找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 133|回复: 0

生成式人工智能在口腔医学的应用潜力与挑战

[复制链接]

15

主题

0

回帖

4312

积分

管理员

积分
4312

突出贡献最佳新人活跃会员热心会员推广达人宣传达人优秀版主荣誉管理论坛元老

发表于 2025-3-25 22:05:01 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
生成式人工智能(generative artificial intelligence,简称生成式AI),也称“人工智能生成内容”(artificial intelligence generated content,AIGC),其目标是通过学习大量的训练数据来理解数据的概率分布,然后利用这种理解生成新的、类似于训练数据的内容,如图像、文本、音频等。
    一些常见的生成式AI模型包括自回归模型(autoregressive model,ARM)、生成对抗网络(generative adversarial network, GAN)、变分自编码器(variational auto-encoder, VAE)等。其中,常见的自回归模型为循环神经网络(recurrent neural network,RNN)和变换器(transformer)。
    2022 年11月30日,美国人工智能公司OpenAI发布了一款名为ChatGPT 的大语言模型。大语言模型(large language models,LLM)通常采用深度学习技术,特别是基于上述提及的神经网络的方法,如RNN 和Transformer,来实现其目的。该生成式AI在人工智能领域引起了重大变革,并有望从专用性人工智能(artificial narrow intelligence,ANI)时代向通用性人工智能(artificial general intelligence,AGI)时代转变。
    值得注意的是,2023年3月15 日,OpenAI发布了自然语言处理的大模型GPT-4,进一步提升了ChatGPT的能力。截止目前,人工智能在医学研究中涵盖了诸多领域,如智能适应学习、自主无人系统、智能芯片、脑机接口、自然语言处理、语音识别、跨媒体分析推理、计算机视觉、机器人和专家系统等。
    在口腔医学领域,人工智能的应用主要包括对影像或病理图像的分析、临床决策支持、专家系统、语音识别系统、达芬奇手术机器人系统、全基因组测序以及唾液的蛋白组学分析。然而,这些应用多属于“分析式AI”领域。相较于传统的“分析式AI”(analytical AI),生成式AI具有独特的优势。最主要的特点是其能够创造新的内容,而不仅仅是对现有数据的识别或分类。
    生成式AI系统通过建立概率模型来描述训练数据的分布。这可以是基于统计方法的模型,也可以是基于神经网络的深度学习模型。模型的目标是捕捉训练数据的内在结构和规律。一旦生成式AI模型学习了训练数据的分布,它就可以用来生成新的数据样本,这些样本在某种程度上类似于训练数据,但又具有一定的差异。
    这种生成能力使生成式AI非常有用,例如自然语言处理(生成文本)、计算机视觉(生成图像和视频)、音频处理(生成音乐和语音)、药物研发、艺术创作等。它们也用于数据增强、样本生成、模拟等任务。这将对人工智能领域产生深远影响,加速强人工智能(general artificial intelligence,GAI)时代的到来。那么,生成式AI的崛起又将给口腔医学领域带来哪些不同的活力与风险呢? 鉴于其潜力,我们有必要对其在口腔医学领域的发展前景进行深入思考。
    1.基于LLM 的生成式AI的基本原理及潜在优势
    1.1 基于LLM 的生成式AI的基本原理
    生成式预训练转化器(generative pre-trained transformer,GPT)系列是代表性的生成式AI模型之一。通过介绍该系列,笔者简要阐述了基于LLM 的生成式AI的基本原理。GPT 系列的基础结构主要由Transformer架构和预训练技术(pre-trained)两部分组成。Vaswani等于2017 年首次提出Transformer,这一开创性的神经网络算法在自然语言处理(NLP)任务中取得了巨大成功,并成为许多生成式AI模型的基础。
    预训练的目标是让模型从大量的文本数据中学习语言的统计规律和上下文信息。GPT1、GPT2与GPT3的构建方式相似,均采用了通过预测下一个单词的方式进行训练,GPT3能够根据简单的提示自动生成文本,智能地回答各种问题,但有时可能会产生无用或错误的输出。为解决这一问题,OpenAI开发了1个三步方案,即无监督学习(unsupervised learning,USL)、监督学习(supervised learning,SL)以及强化学习(reinforcement learning,RL),这便是GPT3.5 即InstructGPT的基础。
    在预训练阶段,GPT 模型首先通过未标记的训练数据(进行自监督学习训练,即USL。预训练完成后,模型进一步在有标签数据(人工编写的问答数据)上进行SL,通过有监督微调(supervised fine-tuning,SFT)来更好地适应特定任务。然而,由于人工编写高质量的问答对费时且昂贵,OpenAI让GPT3为一个问题生成多个答案,由人类按照有用程度进行排序,并训练一个新的奖励模型,用于为每个问题和答案组合评分(人类不直接创造答案,仅进行排序)。
    最后,再次收集外部用户提问以生成答案,使用奖励模型的评分进一步微调训练SFT模型,通过反复迭代的方式实现从人类反馈中的强化学习(reinforcement learning from human feedback,RLHF)。该过程首先使用SL 对模型进行微调(fine-tuning),然后使用 RL 进SL 对模型进行微调(fine-tuning),然后使用 RL 进一步更新模型。SL 阶段允许模型学习任务的基本结构和内容,而 RLHF 阶段则进一步改进模型的响应以提高准确性。ChatGPT从GPT3.5微调而来,采用了相同的人类反馈强化学习(RLHF)来训练,但训练数据是对话而非问答对。
    简言之,ChatGPT是一款基于Transformer架构的GPT系列NLP工具,其本质是一种“大数据+机器学习+模拟演练+微调变换+ 输出优化”的人机智能交互应用程序。最后,在更多的数据训练、更精细的微调以及RLHF 模型的支持下,GPT4的准确率相较于GPT3.5有了显著提升。GPT4 支持多种输入格式,如插图、表格、照片、草图等,并能实现以图编程、据图写作等多种应用。此外,它还支持长文档输入,将单次输入字数从3000 单词扩展到25000 单词。
    在处理特定任务时,除了前述提及的LLM之外,研究者可以对任何LLM 进行微调,例如BioGPT、BioMedLM、BERT、BioMegatron、PubMedBERT、BioClinicalBERT 和BioLinkBERT等,以获得更出色的性能,从而满足特定任务的需求。
    1.2 基于LLM 的生成式AI的潜在优势
    基于LLM 的生成式AI在多个方面展现了潜在的优势,具体如下:
    (1)创造性和创新性:分析式AI主要专注于从已有数据中提取模式和规律,执行数据分析、分类以及预测等任务。与之不同,生成式AI则着眼于创造新的数据,例如在自然语言处理(NLP)中创造新的文本、在图像处理中生成新的图像等。
    (2)自适应性:生成式AI无需预先定义明确的规则,它能够从输入数据中学习数据的概率分布,并根据不同的输入自动调整生成不同的输出。与纯监督学习相比,生成式AI通常无需依赖明确标记的数据,它可以从未标记的数据中学习,并在学习的过程中自动生成标签。这种自适应性赋予生成式AI更大的灵活性,使其能够适应各种任务和应用场景。
    (3)处理不完整数据:生成式模型在处理不完整或有噪音的数据方面表现出色。在某些任务中,输入数据可能存在不完整或缺失的信息,生成式AI能够通过学习概率分布来生成可能的完整数据。
    (4)数据增强:生成式AI可用于扩充数据集,尤其在数据有限或不足的情况下,它能够生成额外的数据样本,有助于提升模型的泛化能力和性能。
    (5)多模态能力:生成式AI能够处理不同类型的数据,包括图像、文本、音频等,并能够在不同类型的数据之间转换和联合生成。
    2.生成式AI在医学领域的应用
    生成式AI给医学领域带来了深远的变革。Med-PaLM 是由谷歌和DeepMind专门为医学领域开发的LLM,最近的报告显示,其在美国医学执照考试(United States Medical Licensing Examination,USMLE)上的准确率接近人类临床专家的水平。另一方面,BioGPT是由微软开发,并在生物医学数据上训练的LLM,在某些生物医学文本生成和挖掘任务上已经达到了与人类相媲美的水平。
    这种强大的性能,结合人机交互对话的便捷性以及LLM 可处理复杂多样提示的能力,在医学领域的信息管理、临床决策和科学研究等方面显示出巨大潜力。由于ChatGPT 在USMLE中表现出色,AnsibleHealth慢性肺部疾病科室的临床医生开始在其工作流程中尝试使用ChatGPT,以协助处理传统繁琐的文书工作,例如病历记录和简化放射学报告等医学术语密集的任务,以便更好地传达给患者,甚至在处理模糊不清且难以确诊的病例时进行头脑风暴和启发灵感。
    研究显示,文书工作占据医生1/4至一半的时间、占据护士1/5的时间,而LLM擅长处理文本内容,还可以用于文本信息的抽取和分析,有助于迅速获取关键信息,如病史、诊断结果、治疗方案等,并构建知识图谱,以便医生在患者转诊时能够迅速获取相关信息。此外,多项实证研究已经对ChatGPT与临床医生在临床决策中的性能进行了比较。
    其中一项研究显示,ChatGPT 在病例鉴别诊断方面的总体准确率为71.7 %;另一项研究评估ChatGPT在[url=]乳腺癌[/url]筛查中选择放射成像技术的决策能力,其平均正确率为88.9%。而目前GPT-4的性能在各个方面均有了显著提升。另外,生成式AI在生命科学和生物医学领域也日益受到关注,展现出在药物研发中提高效率的巨大潜力。
    David Baker的研究利用类LLM 模型进行新型生物分子设计,而生物技术初创企业Insilico Medicine则试图使用生成式AI进行药物靶标发现,这些都展示了生成式AI如何有助于加速新型蛋白质结构的设计和构想。
    3. 生成式AI在口腔医学的应用前景
    生成式AI技术的基础涵盖了多个关键领域,包括自然语言处理(NLP)、机器学习(ML)、深度学习(DL)、语言模型(LM)、强化学习(RL)以及迁移学习(TL)等方向。目前,NLP、ML 和DL 等技术在口腔医学研究领域蓬勃发展。胡敏学者总结了30多年来口腔医学领域人工智能研究的热点变迁,其强调尽管研究不断深入,但普遍认为人工智能在临床实践中的转化和广泛应用仍面临许多挑战。因此,实现人工智能在医学领域的有效应用仍然需要大量工作。随着LLM 技术的崭露头角,有望迎来新的希望和机遇。
    3.1 科研
    在口腔医学研究领域,生成式AI的应用范围十分广泛,涵盖了基于口腔微生物组的病因研究、药物研发、口腔病理图像及放射影像的处理和分析,文献检索与知识图谱构建、实验设计、图表制作及数据分析等多个方面。生成式AI不仅能够模拟口腔微生物组的组成和变化,以深入了解不同微生物组对口腔健康和疾病的影响,还能运用LLM 从生物医学文献中提取微生物与疾病之间的关联。
    此外,生成式AI还有助于生成新型口腔医学药物的候选结构,从而加速药物研发过程,提高药物疗效和安全性。而且生成式AI还能够自动识别和标记口腔病理图像和放射影像,为早期诊断和治疗提供有力支持。值得特别探讨的是,LLM 在科学研究写作领域具备巨大的潜力。
    LLM 有助于医学研究人员和科学家进行文献研究,能够快速分析和总结大量文章,自动生成摘要、提取关键词并进行主题分类,从而快速获取相关领域的最新进展和知识。此外,LLM 还能够协助生成图表、表格和其他视觉元素,用以总结和展示数据、构建文章结构、提供参考文献,并拟定标题,甚至能生成初稿并进行多语言翻译,从而加速学术写作进程并降低难度。同时,它还能协助查找学术论文、总结及分析结论,并突出显示领域内的不确定性,为学术研究提供新的启示。
    LLM 的主要优势在于其迅速理解信息并建立证据之间的联系,相较于人类有限的全面阅读大量文献并连接看似不相关信息的能力,LLM 更能够快速得出结论。此外,它还能够模拟各种研究场景,进行图形绘制、编程,以辅助开展科学实验。在正式实验开始之前,LLM 能够提供实验设计和结果预测,以便更有效地制定研究计划,并且还可以根据研究需求生成大量模拟仿真数据等。
    生成式AI在口腔医学领域的广泛应用预示着其在提高医学研究效率方面发挥重要作用的潜力,同时还有望极大地促进不同学科之间的交叉融合。近期,中国科学技术部会同国家自然科学基金委员会启动了“人工智能驱动的科学研究”(AI for Science,AI4S)专项部署工作,围绕药物研发、基因研究、生物育种、新材料研发等重点领域科研需求展开,布局“AI4S”前沿科技研发体系。为此,将LLM打造为知识工厂,研究服务于科学家的知识自动化方法,将是推动高效AI4S的重要保障。
    当前,国际上多种针对基础研究的分布式开放科学运动(DeSci)正蓬勃兴起,DeSci倡导将科学研究的数据、方法和结果全部公开,并鼓励研究者共享数据和代码,以供其他研究者验证和重现研究结果。通过这种方式,DeSci旨在提高科学研究的可靠性和可复制性,促进科学知识的共享和传播,从而推动科学研究的进步和创新。
    LLM 为DeSci提供了强大的工具和技术支持。科学家可以借助LLM 更为便捷地进行科学文献的搜索、分类和汇总,以找到相关的研究成果并将其整合到自己的研究中。同时,LLM 的NLP和文本生成功能还能助力科学家编写科学论文、报告和综述,提高科学研究的效率和准确性。
    DeSci与LLM 相辅相成,相互推动。LLM 为DeSci提供了强大的文本处理和生成能力,有助于促进科学研究的开放性、透明性和合作性。而DeSci则为LLM 的应用提供了更广阔的领域和更多样化的数据源,激发了其在科学研究中的潜力和应用价值。这种互惠关系将不断推动科学界的进步和创新。
    White认为,这将是科学领域一场巨大的基础设施变革,几乎就像互联网带来的重大变革一样,我们将逐渐认识到,我们有能力将论文、数据程序、图书馆以及我们所使用的计算工作甚至机器人实验紧密连接起来。
    3.2 临床 LLM
    在文本处理方面表现卓越,它通过微调能够轻松掌握口腔医学领域的专业术语,并将其应用于口腔临床文书处理工作。这一技术不仅显著减少了文本处理的时间,还能提供更完善的结果,从而为医生腾出更多时间用于接诊患者。此外,生成式AI可用于构建智能辅助临床决策系统,有助于口腔医生进行疾病诊断、治疗方案制定以及患者治疗效果的预测。
    然而,值得注意的是,国外期刊已发表多项关于LLM 与临床医生在临床诊断中决策准确率对比的实证研究,然而口腔医学领域目前尚缺乏相关实证研究。此外,LLM 还能够整合口腔健康数据,以预测患者未来可能出现的口腔健康问题,从而实现个性化治疗和干预措施。
    结合生成式AI和机器人技术,未来还有机会开发智能口腔医学辅助机器人,这些机器人可以实时检测患者口腔状况并进行图像分析,同时还能协助完成部分口腔治疗任务。此外,生成式AI技术结合虚拟现实技术,能够创建高度逼真的口腔图像和场景,为患者和医生提供一个虚拟环境,在虚拟环境中进行互动和合作,以更好地理解治疗过程和效果,提高治疗的可信度。
    此外,生成式AI还能轻松处理繁琐的工作,如预约、复诊和交代注意事项。借助语音识别和自然语言生成技术,LLM 能够以文字、图像和视频等多种形式向患者提供科普和解答疑问,这种多模态性能有望大大提升医患沟通的效率和效果。最近的研究显示,加州大学圣地亚哥分校在社交网站收集了195个真实的医患问答,经由ChatGPT 回答后,由专家进行盲评。结果表明,ChatGPT不仅在信息质量方面超越了人类医生,而且在同理心方面也胜过了人类医生。
    此外,2023年5月,Belong.Life 推出了Dave,这是世界上第一个专注于癌症患者领域的对话式AI。该系统专注于提供癌症患者与医生之间的24 h沟通支持。我们坚信,像ChatGPT这样的LLM 正在逐渐成熟,不久的将来将很快对整个医学领域产生深远的影响,提升个性化、具备同理心和可扩展性的医疗保健服务水平。
    3.3 教学
    ChatGPT已经在医学教育领域引起了广泛关注和热议。有相关研究在Web of Science中以ChatGPT为主题词搜索得到116篇相关文章,其中医学教育占比高达80%以上。这些研究主题涵盖了自动评分、教学辅助、个性化学习、研究辅助、快速获取信息、生成情景案例、创设学习内容以及语言翻译等多个方面。
    口腔医学教育综合了基础知识、临床思维、操作技能及科研思维等多个方面,借助生成式AI,可以极大地提高教学质量。在口腔医学教育领域,生成式AI的应用呈现以下方面:首先,通过借助生成式AI,可以构建一个更为智能化的虚拟学伴,即口腔医学知识问答系统,为学生提供最前沿的口腔医学知识。这个系统不仅可以回答学生的问题,还能解释复杂的口腔医学概念,进行模拟测试,并提供可视化的教学资料。其强大的上下文学习及逐步推理能力,还能擦出意想不到的知识火花。此外,生成式AI还能辅助编写高质量的口腔医学执业医师考试题目,从而减轻人工编写的负担。
    其次,生成对抗网络(GAN)等生成式AI技术也为口腔医学教育带来了新的可能性。这些技术可以生成模拟口腔医学数据,以替代真实患者数据,从而保护患者隐私。这对于在研究和教育领域共享数据时,避免泄露患者敏感信息具有积极作用。在学术会议方面,生成式AI可自动记录会议内容,进行多语言翻译,并进行总结归纳以供师生学习参考。
    这一技术的应用可以促进国际间学术交流,扩大知识传播范围。最后,通过将生成式AI与虚拟现实技术相结合,我们还能创建沉浸式的口腔医学虚拟现实体验,为学生提供更真实的培训和实践机会。这种综合性的教育方法将有助于培养出更为优秀和有实践经验的口腔医学专业人才。
    然而,还应当认识到,在通用人工智能时代的来临下,传统的教育模式,如单纯的知识点灌输与记忆力训练,已经显得不足以满足时代的需求。因此,如何应对这一变革显得至关重要。在面对新工具时,需要摒弃抵触心态,克服固有习惯,培养自身适应快速变化学习环境的能力,并积极探索其应用。
    对工具的使用,必须充分了解其所具备的优势和缺点。同时,要掌握高层次认知能力以及批判性思维,以善用所掌握的工具。学习系统的升级不仅仅对于个体,也是整个生命系统得以延续的基础,对于人类的认知和改造能力具有深远影响。培养学生的探索精神、自主学习能力、创新思维、沟通技巧、抗挫能力及领导力等素质显得尤为关键。这些素质将使人类能够更好地掌握和引导人工智能技术,从而成为合格的AI主人,这也是未来口腔医学教育需要关注的重要方向。
    4.风险和应对措施
    尽管生成式AI拥有广泛的应用潜力,然而随着这一技术的不断发展和应用,也伴随着多方面的风险和挑战。本文将探讨除了知识产权、责任承担、网络安全等常规开发和商业应用中所涉及的风险之外,生成式AI在医学领域所面临的主要挑战,包括但不限于以下几个方面:首先,隐私问题在医学领域显得尤为突出。医学数据往往涉及患者的敏感隐私信息,因此,需要采用数据脱敏、模糊化或加密等技术,以确保在训练数据中的患者身份和敏感信息得到充分保护。同时,建立新的隐私法规也势在必行,以确保数据的合法使用和处理。
    其次,安全问题在医学领域的应用中至关重要。首先是数据质量问题,在训练过程中,模型需要使用大量数据,其中可能包含错误信息和有害内容。这可能导致模型复制、放大和传播问题内容和错误信息,这在医学领域所造成的危害将无法想象。因此,必须与临床医生和医学专家合作,对训练数据进行验证和检测,以防止数据被篡改、破坏或泄露,并清除训练数据中的有害或错误内容。
    此外,生成式AI缺乏对语言或其他数据形式的真正理解,且无法评估和区分内容的真实性和合理性,这可能导致模型生成不准确的信息。同时,由于其在相同任务或问题上可能产生不同的结果,这带来了可靠性和可复制性的问题,需要持续的人工监督来确保模型的正确稳定的运行。
    第三,偏见问题以及使用的公平性也是必须重视的问题。训练数据必须具有多样性,包括不同种族、性别、文化背景等,以减少模型的偏见。此外,模型的定价策略可能引发地区使用不公平的问题。这也需要引起高度关注。第四,伦理问题是不容忽视的挑战。为了解决模型的不透明性和不可解释性,必须制定明确的伦理指南,明确研究和应用中的伦理原则。同时,滥用在风险社会的背景下变得尤为重要,包括科研领域中可能出现的虚假舞弊。
    为了应对这一挑战,需要规范使用情况的披露义务,以确保研究者在其科研作品中披露其对AI的使用情况,从而维护研究的诚信和透明度。最后将生成式AI技术真正应用于临床实践需要克服技术与实际场景之间的鸿沟,必须全面改进以上所述各个方面,以确保模型的准确性和稳定性。目前,欧盟正在制定一项统一的人工智能法案(AI Act),以实现对人工智能应用的全面监管。类似于之前的数据隐私法规《一般数据保护条例》(GDPR)对全球科技行业的影响,欧盟人工智能法案将在人工智能领域扩展“布鲁塞尔效应”,成为引领全球AI治理标准的先导。希望在未来生成式AI能够在合理的监管下为人类带来福祉。
    5.总结
    生成式AI在医学领域具有巨大的应用潜力,尤其在口腔医学科研、临床实践和教学方面,展现出广阔的应用前景。然而,使用生成式AI也伴随着一些潜在风险,医生应谨慎使用生成式AI,将其视为一种辅助工具,而非全面替代医学专业知识和临床判断的工具,严格评估其输出结果的质量和相关性。医生在决策和知识检索过程中扮演着不可替代的角色,需要保持警惕并不断更新知识和技能,以适应新兴技术的发展和应用。总体而言,合理应用生成式AI可以为医学领域带来巨大的益处,但同时也需要妥善处理潜在风险并采取适当的对策。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|义齿论坛

GMT+8, 2025-8-30 12:57 , Processed in 0.767578 second(s), 23 queries .

快速回复 返回顶部 返回列表