审稿人或难识别AI撰写的论文摘要

科技|来源:科技日报2023-01-18 08:54:00|网络编辑:孟宪静

  据近日发表在预印本服务器bioRxiv上的一项研究,人工智能(AI)聊天机器人ChatGPT已可写出令人信服的假研究论文摘要,甚至连审稿科学家也无法发现。

  聊天机器人ChatGPT会根据用户提示创建逼真文本,它通过消化大量现有的人类生成文本来学习执行任务。美国的软件公司OpenAI于去年11月发布了该工具,并供用户免费使用。

  自发布以来,研究人员一直在努力解决相关伦理道德问题,因为它大部分输出可能很难与人类撰写的文本区分开来。近日美国西北大学的一个研究小组使用ChatGPT生成人工研究论文摘要,以测试科学家是否可辨别它们。

  研究人员要求机器人基于发表在《美国医学会杂志》《新英格兰医学杂志》《英国医学杂志》《柳叶刀》和《自然·医学》上的50篇研究编写摘要。然后,他们通过抄袭检测器和AI输出检测器将这些摘要与原始摘要进行比较,并要求一组医学研究人员找出编造的摘要。

  结果,ChatGPT生成的摘要通过了抄袭检查器,原创性得分中位数为100%,表明没有检测到抄袭。人工智能输出检测器发现了66%的生成摘要,但人工审稿人只正确识别了68%的生成摘要和86%的真实摘要,他们错误地将生成摘要中的32%识别为真实,将14%的真实摘要识别为编造。

  研究人员称,ChatGPT写出了能骗过人类的科学摘要,如果科学家无法确定研究是否属实,或会产生“可怕的后果”。

  研究人员表示,在虚假信息会危及人们生命安全的医学等领域,期刊需要采取更严格的方法来验证信息的准确性。而这些问题的解决方案,不应集中在机器人本身,“而是导致这种行为的不正当激励措施,例如通过论文数量进行招聘和晋升审查,而不考虑其质量或影响”。(记者张梦然)

网友评论 [新闻评论服务协议]

网站简介 | About BBRTV | 广告服务 | 联系我们 | 专题回顾 | 中文简体 | English | tiếng Việt Nam | ภาษาไทย

广西广播电视台 版权所有

广西壮族自治区互联网信息办公室 支持指导

广西广播电视台 主办

本网站由北部湾在线版权所有,未经授权禁止复制或建立镜像