首页 > 运营技巧 > 运营技巧 > 谷歌AI破译古籍新巅峰:错误率仅0.56%,准确率媲美人类专家

谷歌AI破译古籍新巅峰:错误率仅0.56%,准确率媲美人类专家

发布时间:2025-11-16 14:04:34
11 月 16 日消息,科技媒体 golem 昨日(11 月 15 日)发布博文,报道称谷歌通过其 AI Studio 平台,正测试一款尚未命名的 AI 模型,在破译难以辨认的历史手稿方面已接近人类专家的水平。
 
IT之家援引博文介绍,历史学家 Mark Humphries 使用一套专门开发的基准数据集,系统性地测试了该模型的性能。结果表明,在处理五份高难度历史手稿时,该模型的整体字符错误率约为 1.7%,其中大部分错误涉及标点符号和大小写,而非单词本身。
 
 
 
Humphries 的评估进一步指出,如果排除模糊的标点符号和大小写错误,该 AI 模型的字符错误率将骤降至约 0.56%,相当于每转写 200 个字符才出现一个错误。
 
根据新发现的未知 Gemini 型号转录的奥尔巴尼账簿页面
 
这一惊人的准确度,让其性能足以与从事历史文献转写的专业人类工作者相提并论。此次测试的文档涵盖了 18 至 19 世纪的多种手写风格,其中不乏字迹潦草、拼写错误和语法不一致的复杂样本,进一步凸显了该模型的强大能力。
 
该模型最令人意外的表现,是其超越了简单的文字转写,展现出复杂的推理能力。在处理一份 18 世纪商人的日记时,原文中有一条关于购买糖的记录,仅标记了数字“145”,并未注明计量单位。
 
谷歌的 AI 模型并未直接转写为“145”,而是输出了“14 磅 5 盎司”。研究人员发现,AI 是通过反向计算账本中记录的总价,并结合当时英国的货币(磅、先令、便士)与重量单位关系,才成功推断出这一结果。
 
 
 
尽管初步结果令人振奋,但 Humphries 也强调了当前评估的局限性。由于该模型通过 A/B 测试形式零星出现,系统性地进行大规模测试存在困难,目前仅评估了基准数据集中约 10% 的样本。
 

运营技巧更多>>

国产奔驰GLE轴距将超3米!多款新车动态一览,保时捷纯电SUV技术亮眼 宇树、智元竞争春晚赞助席位,机器人要在马年除夕包饺子? 售17.58万元起!领克10 EM-P新车型上市,默认标配千里浩瀚H5方案 莲花首款插混SUV“For Me”亮相,零百加速3.3秒 Intel 10核锐炫B370集显跑分曝光:超越RTX 3050 手动叠片过滤器领域标杆企业榜单:山东淋垚智慧农业科技领航发展 东风日产NX8来了,这位N系列最新成员如何? 华硕ROG CES 2026暨品牌20周年发布活动1月6日7:00举行 小米17 Pro系列手机获HyperOS 3.0.34.0升级,背屏可养小宠物 ChatGPT增长红利见顶:月活增速骤降至6%,谷歌Gemini全维度反超 探访济南机器人6S中心:家庭陪伴类机器人受热捧 大雪节气,为啥要喝红薯粥? 苏州地铁女子用羊绒围巾擦奶茶渍,官方全网寻人送厚礼 刀疤哥退赛后直播!2小时观众狂刷礼物赚84万,网友还要送他别墅 宾利的第二款SUV要来了,定位低于添越,纯电动力 汽车市场动态解读:新能源车型与智能驾驶技术前沿资讯 日产NX8来袭!中大型定位,增程纯电双版本,续航动力亮点足 馈电亦如龙,静谧如纯电?全新极狐阿尔法T5增程版广州实测 长安福特新蒙迪欧焕新登场,14.98万起售,配置动力亮点满满 极狐2026年推全新MPV,磁流变底盘加持,能否撼动腾势D9地位? 中控台环抱式设计,弧形双联屏,奥迪粉等等新车! 别克至境世家上市,以百万级实力打造健康智能出行,重塑高端MPV新标杆 东风日产NX8公告图亮相,800V+5C超充加持,打造家庭新能源出行新选择 吉利全新一代超级AI增程混动技术首发银河V900 景网钛投标搭载“数字方案爵士大模型”入围武汉首批AI产品资源池,原生技术实力出圈 生物科学的“解码器”:面向未来的科研分析技术体系 劲酒为何成为当代年轻女牲的“神仙水” 明日大雪,无论多忙,记得:大雪“最不能”做的5件事,别大意 47冠!梅西首夺美职联总冠军,历史第一人刷新纪录,领先C罗11冠 三星堆与秦始皇帝陵竟有联系