-
hb游戏网站:因为人们可能没有意识到它给出的答案是不准确的
时间:2023/5/18 9:13:30 作者: 来源: 阅读:0 评论:0内容摘要:说最新版本的ChatGPT通过了美国放射学委员会的考试,突出了大型语言模型的潜力,但它也给出了一些错误的答案,表明人们仍然需要检查他们提供的答案。为了评估ChatGPT在美国放射学委员会考试中的表现,并探索其优势和局限性,多伦多大学的研究人员首先测试了基于GPT-3.5的ChatGPT的性能。研究小组使用了150道选择...说最新版本的ChatGPT通过了美国放射学委员会的考试,突出了大型语言模型的潜力,但它也给出了一些错误的答案,表明人们仍然需要检查他们提供的答案。
为了评估ChatGPT在美国放射学委员会考试中的表现,并探索其优势和局限性,多伦多大学的研究人员首先测试了基于GPT-3.5的ChatGPT的性能。研究小组使用了150道选择题,这些选择题的风格、内容和难度都与加拿大皇家学院和美国放射学委员会的考试相匹配。这些问题不包括图像,分为低阶(知识回忆、基本理解)和高阶(应用、分析、综合)思维问题。高阶思维问题可进一步细分为影像学表现描述、临床管理、计算与分类、疾病关联。hb游戏网站
研究人员发现,基于gpt -3.5的ChatGPT答题正确率为69%,接近70%的通过率。该模型在回答低阶思维问题时表现相对较好,准确率为84%,但在回答高阶思维问题时表现不佳,准确率仅为60%。表现较好的GPT-4有81%的正确率,在高阶思维问题上有81%的正确率,比GPT-3.5好得多。但在低阶思维问题上,GPT-4的正确率只有80%,回答了12个问题,而GPT-3.5回答了所有这些问题,这引起了研究小组对GPT-4收集的信息可靠性的担忧。
两项研究都表明,ChatGPT有提供错误答案的倾向,如果仅仅依靠它来获取信息,这是非常危险的,因为人们可能没有意识到它给出的答案是不准确的,这是它目前面临的最大问题。
上一篇:没有了
下一篇:hb游戏网站:欧洲国家对俄罗斯的制裁正遭遇能源短缺
本类更新
-
05-18hb游戏网站:因为人们可能没有意识到它给出的答案是不准确的
-
05-15hb游戏网站:欧洲国家对俄罗斯的制裁正遭遇能源短缺
-
05-12hb游戏网站:为保障人民群众的生命安全和身体健康作出了突出贡献
-
05-09hb游戏网站:科技创新中心建设的核心在于人
-
05-06hb游戏网站:它还引发了严重的经济危机和社会动荡
-
05-03hb游戏网站:作家很难找到新的思路和新的突破
-
04-30hb游戏网站:主导旅游战略的武汉轮渡迎来了一波游客潮
-
04-27hb游戏网站:开展水肥一体化智能栽培模式
-
04-24hb游戏网站:取得了多项原创性的科学成果
-
04-21hb游戏网站:游客不仅可以观看景点的实时地图和路线指南
本类推荐
本类排行
-
06-20888真人集团网址:保证义务教育是减轻贫困的一项重要任务
-
06-18888真人集团网址:短途运输航线恢复度近100%
-
06-19888真人集团网址:村民走过谷底新修的便民桥
-
06-25888真人集团网址:智能控制的集装箱牵引车自动驱动
-
06-21888真人集团网址:全国通用高速铁路上实施了电子机票
-
06-23888真人集团网址:手续费捆绑触摸红线
-
06-22888真人集团网址:大龙经济开发区拆迁服务中心工作人员走上了大门
-
06-24888真人集团网址:中国今年将向原子能机构捐款100万美元
-
06-26888真人集团网址:最快的速度到达这里
-
11-15888真人集团网址:促进现代化的国家治理体系和治理能力