Skip to main content

Search: #医疗AI

  1. 来一点医学科学前沿🤯🤯🥹🥹
    近半数 AI 聊天机器人医疗回答有问题:五大模型医疗准确性审计 当你用 AI 聊天机器人问健康问题时,得到的答案靠谱吗?这项研究对这一问题进行了系统审计。随着 Gemini、DeepSeek、ChatGPT、Meta AI、Grok 等聊天机器人被大众广泛当作"搜索引擎"使用——包括查询日常健康和医疗问题——其回答质量却鲜有严格审查。 研究人员在 2025 年 2 月对五大主流聊天机器人进行了压力测试:每个机器人回答 10 道来自癌症、疫苗、干细胞、营养和运动表现五个领域的问题,并使用对抗性提示策略(adversarial…
    AI 已经能“像医生一样思考”了吗?一项顶级研究给出了冷静答案

    很多人都有过这样的体验:看病时医生时间紧、信息不全,诊断往往依赖经验判断。那问题来了——如果把这些复杂病例交给 AI,它真的能做得更好吗?4 月底发表在《Science》的一项研究,首次把最新一代大语言模型,直接拉到真实医学场景中,与数百名医生“正面对比”。

    研究团队评估了 OpenAI o1 系列模型在多种临床推理任务中的表现,包括《新英格兰医学杂志》的经典疑难病例、虚拟临床推理训练案例、真实急诊室患者,以及诊断和治疗方案制定等任务。结果显示,在多个实验中,o1 模型在诊断准确率、鉴别诊断质量和管理决策评分上,整体都高于住院医师和资深医生。例如,在 NEJM 疑难病例中,模型 78% 的情况下能把正确诊断纳入鉴别诊断;在真实急诊分诊阶段,模型给出“准确或非常接近正确诊断”的比例达到 67%,高于两位资深内科医生。研究并未深入解释模型“为什么”能做到这一点,只是指出其在信息有限、时间紧迫的场景下,综合文本信息的能力更稳定。

    这并不意味着 AI 可以取代医生。作者明确强调,研究仅评估了文本推理能力,而真实医疗还依赖体格检查、影像、声音和情境判断。此外,这些结果主要来自内科和急诊医学,不能代表所有专科。更重要的是,目前研究只是“性能比较”,真正能否改善患者结局,还需要前瞻性临床试验。但可以确定的是,AI 作为“第二意见”的潜力已经非常现实,医疗系统需要开始认真思考如何安全地与它协作。

    AI 已经在急诊分诊赢了医生,但离“真正看病”还差好几步 🤖🩺


    📖SciencearXiv
    🗓2026-04-30

    #人工智能 #医学诊断 #大语言模型 #临床决策支持

    Via:一往无前啊屁林

    🧬 频道🧑‍🔬 群组📨 投稿
    ❤️ 5
  2. 医疗 AI 也会被误导——研究提示“像病历的错误信息”最危险

    大模型正越来越多地被用于问诊分诊、病历总结和医学问答。但如果错误信息被包装得足够“像真的”,它们会不会照单全收?这项发表于 The Lancet Digital Health 的横断面基准研究,系统测试了 LLM 在医疗虚假信息面前的脆弱性。

    研究团队评估了 20 个大语言模型,在 340 万条含医学错误信息的提示词中测试其易感性,错误信息来自社交媒体、临床笔记和模拟病例三类场景。结果显示,整体有 31.7% 的基础提示会让模型接受错误信息;其中临床笔记场景最危险,易感率高达 46.1%,显著高于社交媒体场景的 8.9%。不同模型表现差异明显,GPT-4 抗误导能力更强,而部分小模型和医学微调模型反而更容易“中招”。

    这项研究最重要的提醒不是“模型不行”,而是医疗 AI 的部署不能只看答得像不像,还要看它在被误导时能否守住底线。未来真正关键的,可能是事实锚定、来源校验和上下文防御机制,而不是单纯更大的参数规模。

    不是 AI 太笨,而是假病历太像真的——穿白大褂的谣言果然更危险。🩺🤖
    📄 The Lancet Digital Health

    #医疗AI #大语言模型 #医学虚假信息 #柳叶刀 #临床安全

    🧬 频道🧑‍🔬 群组📨 投稿
    🌚 5 ❤️ 2
  3. 🤖 ChatGPT Health"体检不合格":紧急与不紧急情况易出错,漏诊风险高

    随着AI健康助手越来越普及,我们是否应该相信它能准确判断是否需要紧急就医?一项新研究对ChatGPT Health进行了严格测试,结果却揭示了令人担忧的漏洞。

    研究团队模拟了960个临床场景,发现系统在处理极端情况时表现最差。比如,对于糖尿病酮症酸中毒等紧急情况,系统竟有52%的漏诊率,建议患者等待24-48小时,而非立即去急诊。更奇怪的是,当家人或朋友淡化症状时,AI的分诊建议会显著偏向不紧急,风险比高达11.7倍。此外,在处理自杀意念时,危机干预信息有时会错误激活。

    这些发现表明,AI分诊系统在真实世界应用中可能存在严重的安全隐患。虽然患者种族、性别等因素未显著影响结果,但置信区间未排除临床意义差异,意味着仍需更多研究。研究警告,在缺乏充分验证前,不应将此类系统大规模用于消费者健康服务。

    AI分诊也怕极端情况,紧急和没病都容易搞错🤯


    来源:Nature medicine

    #AI医疗 #分诊系统 #ChatGPT #健康助手 #医疗AI #安全风险

    via: 热心群友

    🧬 频道🧑‍🔬 群组📨 投稿
  4. 可穿戴AI设备实现斜视“一键”诊断?新方法或改变传统检查方式

    斜视是影响约4%儿童的常见问题,不仅损害视力,还可能引发心理困扰。传统诊断需多种仪器,步骤繁琐,儿童难以配合,成本也较高。一项新研究提出了一种AI集成的可穿戴设备,可能让诊断更简单。

    该设备像皮肤一样轻薄(约60微米厚),佩戴在眼睑上,通过多方向应变传感器测量眼睑变形。结合生物力学模型和AI算法,能同时测量斜视角度并识别受影响的肌肉。研究显示,其四方向分类准确率达96.6%,测量精度为1.2度,与临床标准高度一致。

    这项技术将生物力学传感与数字诊断结合,可能提高诊断客观性,降低成本,尤其对儿童友好。不过,目前研究主要基于儿童样本,且仍需更多临床验证,以确定是否适用于所有斜视类型。

    斜视检查终于不用再被仪器“折磨”啦!🤩


    来源:Science advances

    #斜视诊断 #可穿戴设备 #人工智能 #儿童视力 #医疗科技

    🧬 频道🧑‍🔬 群组📨 投稿
    ❤️ 5