V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
v2lhr
V2EX  ›  分享发现

细思恐极!用 iPhone 备忘录扫描文件竟被识别内容!

  •  1
     
  •   v2lhr · 2020-08-07 13:20:45 +08:00 · 7470 次点击
    这是一个创建于 1604 天前的主题,其中的信息可能已经有所发展或是发生改变。

    由于报销需要发票扫描件,因此今天我用 iphone 的备忘录扫描了我的医院发票,存储后文件居然被命名为:Medicine fee !这就意味着 iPhone 识别了我的文件内容!这样搞对于私密文件来说也太危险吧!!

    65 条回复    2020-08-19 15:55:51 +08:00
    bruce00
        1
    bruce00  
       2020-08-07 13:30:58 +08:00
    现在各家的拍照、扫描都会整点识别功能进来。。iphone 应该是离线识别吧
    sidkang
        2
    sidkang  
       2020-08-07 13:33:25 +08:00
    各家都有加类似的功能啊,比如照片里都有人脸识别
    lloovve
        3
    lloovve  
       2020-08-07 13:33:45 +08:00 via iPhone
    不科学啊,你多扫描几次,看看都是什么名字,每个都是同样名字会有问题吧
    takemeaway
        4
    takemeaway  
       2020-08-07 13:36:44 +08:00
    iPhone 小技巧里面都说了。
    你有机密吗? 机密的地方不允许带手机的
    crs0910
        5
    crs0910  
       2020-08-07 13:36:45 +08:00 via iPhone
    它还可以搜索🔍到图片内容
    lifeforwater
        6
    lifeforwater  
       2020-08-07 13:41:12 +08:00   ❤️ 8
    1 楼这回复绝了,类比下:
    xx 酒店装有摄像头 —> 现在各家酒店都有,xx 酒店的摄像头应该是离线的
    back0893
        7
    back0893  
       2020-08-07 13:42:37 +08:00
    没啥问题,
    不是国产的,安全
    learningman
        8
    learningman  
       2020-08-07 13:46:10 +08:00   ❤️ 2
    只要清楚地认识到:“现代社会个人不存在隐私”这个事实,并且学会掩耳盗铃,日子就会舒服很多。
    说不是国产的安全。。。。我不禁怀疑是反串还是思想出了问题
    Leonard
        9
    Leonard  
       2020-08-07 13:50:09 +08:00   ❤️ 1
    @lifeforwater 这类比明显不对,酒店摄像头就算离线,相关工作人员也可以看,手机摄像头离线只有自己能看
    ScotGu
        10
    ScotGu  
       2020-08-07 13:51:03 +08:00   ❤️ 12
    这就是科技进步呀!

    顺便炸个鱼~ 如果标题中的 iPhone 改成任何国产品牌,尤其是小华,那绝对是大型讨伐现场了。
    Leonard
        11
    Leonard  
       2020-08-07 13:53:47 +08:00   ❤️ 1
    @ScotGu 如果是偷偷上传被发现,哪个品牌都一样被讨伐,如果识别了以后主动给用户看,性质就不一样
    xz410236056
        12
    xz410236056  
       2020-08-07 14:21:22 +08:00   ❤️ 2
    恐个屁啊,第一次用 iPhone 啊,本来就是作为功能推出的。你也说了是扫描!不是拍照。那是两个功能。
    hoyixi
        13
    hoyixi  
       2020-08-07 14:27:47 +08:00
    FaceID: 你都不要 face 了,还在乎啥? :)

    另外,各个手机(操作系统、浏览器、电商、各种社交 App )厂商的后台云肯定掌握着你的隐私大数据,然后我个人觉得区别就是:这些数据会不会给第三方,依据什么标准共享给第三方
    yov123456
        14
    yov123456  
       2020-08-07 14:27:48 +08:00   ❤️ 4
    苹果 wwdc 说了。。都是离线模型识别的。。
    waylybaye
        15
    waylybaye  
       2020-08-07 14:30:08 +08:00   ❤️ 1
    不用怕,苹果的 OCR 是设备端的识别,不是云端的。
    yukiww233
        16
    yukiww233  
       2020-08-07 14:34:06 +08:00
    谷歌 ml kit 的离线物体识别模型只有几 M
    已经是很成熟的技术了
    xingyuc
        17
    xingyuc  
       2020-08-07 14:46:18 +08:00
    离不离线开了飞行再试试
    ios 闭源,只能抓个包试试?
    xinghen57
        18
    xinghen57  
       2020-08-07 14:51:15 +08:00 via iPhone
    楼上正解。
    好奇楼主来着吐槽,是求心理安慰么?
    ifxo
        19
    ifxo  
       2020-08-07 14:57:48 +08:00
    恐个 p,你说的每一句话淘宝都能听见
    v2lhr
        20
    v2lhr  
    OP
       2020-08-07 15:24:40 +08:00
    @xinghen57 图个屁心里安慰,我是觉得完全不应该未经用户同意就识别文件内容,还有告知大家这个发现,算是提醒一下大家而已。反正我第一反应是震惊。
    v2lhr
        21
    v2lhr  
    OP
       2020-08-07 15:31:11 +08:00
    @ScotGu 还真可能是...
    v2lhr
        22
    v2lhr  
    OP
       2020-08-07 15:33:25 +08:00
    @yov123456 我开始也想这会不会是离线的,但是以我有限的知识觉得不太可能
    otakustay
        23
    otakustay  
       2020-08-07 15:35:53 +08:00
    据我所知,iOS 的识别是 on device AI,纯离线的
    falcon05
        24
    falcon05  
       2020-08-07 15:40:27 +08:00 via iPhone
    不但能识别,默认设置下你的备忘录还会上传到 iCloud 上呢
    oIMOo
        25
    oIMOo  
       2020-08-07 15:41:40 +08:00
    首先要明确一点,你使用备忘录前,是仅在本地储存,还是需要 iCloud 备份?

    前者的话,你把它联网权限禁掉了之后再试试。
    如果是离线识别,那就问题不大。

    后者的话,你是担心它知道你存了什么?
    这又分为机器知道,还是人知道。
    前者像楼上说的照片搜索,后者就是明知道储存里有大量的银行卡信息,员工也没权限+没能力访问到(比如存在 Apple Pay 的银行卡信息)。

    大概就是这样吧。
    BadReese
        26
    BadReese  
       2020-08-07 15:45:42 +08:00
    有什么好猜的 网络一关再扫一次不就行了
    kera0a
        27
    kera0a  
       2020-08-07 15:46:49 +08:00 via iPhone
    @v2lhr
    判断是不是离线识别,不需要啥知识,有手就行。
    拔掉手机卡,关闭家里的 WIFI 电源,再扫一次其他没扫过的文件看是否能识别。
    est
        28
    est  
       2020-08-07 15:49:52 +08:00
    其实不一定需要 OCR 识别内容的。现在图像分类是端到端的了。

    什么意思呢?就是一个黑盒子可以把任意图片归类到它觉得最适合的一个类别。

    具体怎么识别的,谁也无法解释。
    rockeyshao
        29
    rockeyshao  
       2020-08-07 16:04:24 +08:00 via iPhone
    苹果其实不是非常干净,不过至少人家敢承认,之前上传 siri 语音都承认了,不过在国内不怎么好起诉苹果
    luhe
        30
    luhe  
       2020-08-07 16:48:03 +08:00
    这在贴吧叫破事水...
    DAMNYOU
        31
    DAMNYOU  
       2020-08-07 16:50:40 +08:00
    屁大点事,你应该庆幸 那是 iPhone 获取了你的信息,如果是安卓的。。呵呵,而且这是明面上的,暗地里的说出来 估计你都要吓死

    你手机没有任何一丝隐私,你的手机剪贴板一天不知道要被多少软件读取多少次,那都是你没有感知的。
    nomansky
        32
    nomansky  
       2020-08-07 16:52:50 +08:00
    连出行健康码大家都习以为常了,一个 orc 识别有啥好惊讶的...
    Yangz
        33
    Yangz  
       2020-08-07 16:54:53 +08:00
    @bruce00 嗯嗯,确实是离线的来着
    dddd1919
        34
    dddd1919  
       2020-08-07 17:12:40 +08:00
    离线识别,在线上传🐶
    yintao0303
        35
    yintao0303  
       2020-08-07 17:38:44 +08:00
    搜索还能搜到图片中的文字呢。
    dingdangnao
        36
    dingdangnao  
       2020-08-07 17:46:15 +08:00
    屁大个事也恐。。
    reedthink
        37
    reedthink  
       2020-08-07 18:19:25 +08:00
    这个视频 https://www.bilibili.com/video/BV1zf4y1X7i5 ,3:30 有介绍这个功能。顺带一提,手机的算力搭配如今成熟的识别模型,做这个功能没什么难的。
    no1xsyzy
        38
    no1xsyzy  
       2020-08-07 18:25:23 +08:00   ❤️ 1
    @v2lhr #22 你这知识也太有限了……
    训练好的模型用(相对)特化的电路运行没多少消耗的,iPhone 的确有加神经网络模块
    树莓派不用说,就是 RISC-V 一个宣传点就是极低功耗的即时离线机器视觉模块,差不多鼠标拖进去直接流片就行
    稍微关注点数码的新闻就不至于……
    yeeyeung
        39
    yeeyeung  
       2020-08-07 19:03:27 +08:00   ❤️ 1
    楼主的意思应该是扫描功能加不加 OCR 需要用户指定而不是自动化完成
    otakustay
        40
    otakustay  
       2020-08-07 20:55:45 +08:00
    @yeeyeung 这种要求唯独对苹果来说不现实,这家公司就喜欢替用户做决定
    devlnt
        41
    devlnt  
       2020-08-08 05:46:48 +08:00
    你扫的应该是有二维码的发票吧。。。
    s1th
        42
    s1th  
       2020-08-08 06:10:22 +08:00 via iPhone
    竟然有说苹果不太干净的,哈哈,苹果不太干净,其他家应该是在泥坑里垃圾堆打滚了。矮个子里拔高,一群公司被特靠谱干翻,真当人家是闲的蛋疼就抓着你最大的公司怼?
    uasier
        43
    uasier  
       2020-08-08 09:50:04 +08:00
    @s1th 然后就是 tiktok,wechat
    再然后会是谁呢,
    反正你的意思就是国内公司都是该的呗。
    uasier
        44
    uasier  
       2020-08-08 09:52:22 +08:00
    @uasier 因为他们"不干净",哈哈哈
    v2lhr
        45
    v2lhr  
    OP
       2020-08-08 10:13:00 +08:00
    @devlnt 没有二维码的
    v2lhr
        46
    v2lhr  
    OP
       2020-08-08 10:13:35 +08:00
    @yeeyeung 是,识别前应该明确告知用户
    lshzhhi
        47
    lshzhhi  
       2020-08-08 10:53:08 +08:00 via iPhone   ❤️ 2
    @uasier 微信去年三月刚被人拖了库,爆了“聊天记录只在本地存储”的数十亿条聊天记录和大量大陆账户的身份证号和手机号信息

    祝您个人隐私平安,银行账户平安
    jon
        48
    jon  
       2020-08-08 10:53:13 +08:00
    又在对房间里的大象视而不见
    js9527
        49
    js9527  
       2020-08-08 11:12:51 +08:00 via iPhone
    说句不好听的,苹果都这样了,其他品牌手机更可想而知!
    xuanbg
        50
    xuanbg  
       2020-08-08 11:37:18 +08:00
    离线识别并不代表就安全!完全可以在线上传数据嘛。


    备忘录肯定是上传数据到 iCloud 的,所以……
    zhjie
        51
    zhjie  
       2020-08-08 12:16:43 +08:00
    这不就相当于你用手机拍了照,相册里面存了你的照片,
    然后震惊!我的手机竟然有我拍的照片!!!!
    mazyi
        52
    mazyi  
       2020-08-08 16:15:08 +08:00 via iPhone
    细思极恐,用 google photo 拍照居然识别出了我的 jb 和别人的 jb,这么搞对私密器官来说也太危险了吧
    Yucher
        53
    Yucher  
       2020-08-08 16:39:53 +08:00 via iPhone
    @lifeforwater #6 杠精行为
    minamike
        54
    minamike  
       2020-08-08 18:01:03 +08:00 via iPhone
    这不是自带备忘录的特性吗...
    uasier
        55
    uasier  
       2020-08-08 19:19:45 +08:00
    uasier
        56
    uasier  
       2020-08-08 19:23:59 +08:00
    uasier
        57
    uasier  
       2020-08-08 19:35:40 +08:00
    @lshzhhi 我想表达的是社交软件天下一般黑,然后你说的事情我也查了一下,我认为你的说法十分的不严谨,“聊天记录只在本地存储”和数据传输的时候被截取(网吧环境),被记录,导致被保存,不是一件对立的事情。
    再附上一个有趣的仓库 https://github.com/ffffffff0x/Dork-Admin
    uasier
        58
    uasier  
       2020-08-08 19:37:38 +08:00
    当然这个有些偏题,因为这个主题说的是公司主题滥用隐私数据,而不是无法有效管理个人隐私数据
    dingwen07
        59
    dingwen07  
       2020-08-09 06:30:54 +08:00 via iPhone
    用过 Office Lens 吗?那个也会识别内容
    zhouweiluan
        60
    zhouweiluan  
       2020-08-10 10:54:55 +08:00
    众所周知
    Apple 注重本地计算,所以 Apple 设备的性能都做得非常高。
    Google 注重云端计算,所以 Android 设备的性能要求可以做得非常低。
    wakhh
        61
    wakhh  
       2020-08-12 16:17:15 +08:00
    @uasier chrome 浏览器本地保存的密码太不安全了,他还提示我 33 条密码已泄露,请尽快修改,我想打死他。chrome 存储到本地的历史记录 cookie 密码都是 sqlite 文件,都能被各种浏览器导入,工具导入读取。之前看 Tmp 缓存和文件读取记录,发现未知进程一直偷偷复制这些数据库文件,最早的时候是完全复制,导致 C 盘爆满,后来观测几天,就改成了增量复制,但怎么研究,都发现不出来是哪个恶心的 PC 软件。所以我现在已经不用 chromeb 保存密码了。
    wakhh
        62
    wakhh  
       2020-08-12 16:17:53 +08:00
    chrome 浏览器本地保存的密码太不安全了,他还提示我 33 条密码已泄露,请尽快修改,我想打死他。chrome 存储到本地的历史记录 cookie 密码都是 sqlite 文件,都能被各种浏览器导入,工具导入读取。之前看 Tmp 缓存和文件读取记录,发现未知进程一直偷偷复制这些数据库文件,最早的时候是完全复制,导致 C 盘爆满,后来观测几天,就改成了增量复制,但怎么研究,都发现不出来是哪个恶心的 PC 软件。所以我现在已经不用 chromeb 保存密码了。
    @v2lhr @ScotGu @lifeforwater @yov123456 @learningman @xz410236056 @lshzhhi @Leonard @waylybaye @no1xsyzy @yeeyeung @bruce00 @sidkang @lloovve @takemeaway @crs0910 @back0893 @hoyixi @yukiww233 @xingyuc @xinghen57 @ifxo @otakustay @falcon05 @oIMOo @BadReese @kera0a @est @rockeyshao @luhe @DAMNYOU @nomansky @Yangz @dddd1919 @yintao0303 @dingdangnao @reedthink @devlnt @s1th @uasier @jon @js9527 @xuanbg @zhjie @mazyi @Yucher @minamike @dingwen07 @zhouweiluan
    crs0910
        63
    crs0910  
       2020-08-12 17:43:22 +08:00   ❤️ 1
    xingyuc
        64
    xingyuc  
       2020-08-13 08:53:09 +08:00
    @wakhh 我前段时间也发现了,部分软件开发者真是没有下限,真特么想捅他;
    @crs0910 你这个太麻烦了,我也是才发现了读取这么简单,https://github.com/cckuailong/HackChrome
    wakhh
        65
    wakhh  
       2020-08-19 15:55:51 +08:00
    @xingyuc 我发现我泄露的密码都是局域网内的各种局域网 ip 网站,密码 123456,admin 那种。。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2744 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 13:50 · PVG 21:50 · LAX 05:50 · JFK 08:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.