语料“加速器”、AI健康顾问,大模型上下游成果秀技

发布时间:2025-06-15 02:20

7月4日开幕的2024世界人工智能大会(WAIC)正在上海举办,现场版“百模大战”连日来上演,在众多基础大模型集中亮相的同时,从在医疗、农业、金融等行业落地的大模型应用,到为大模型获取“语料”扫清堵点的大模型“加速器”,一批大模型上下游创新成果也集中亮相。

如果将大模型比喻为正在疾驰的科技列车,语料便是珍贵的“燃料”。对中国的大模型企业而言,语料短缺问题仍然严峻。据悉,当前大模型数据集主要为英文,中文语料占比较低,跨页表格、复杂公式等元素的处理仍是大模型语料处理中的“拦路虎”。作为支撑大模型语料训练的大模型行业上游关键技术之一,合合信息展出的大模型“加速器”,最快1.5秒就能完成对百页长文档中的文本、表格、图像等非结构化数据的解析,帮助大模型加速从海量文档中高效提炼“智慧燃料”。

在展区现场,参观者可以选择物理、医学、金融、社会学等多个知识领域的文档,向大模型提问专业问题,例如对特定表格内容的总结、关键要素的分析等。对比测试结果显示,加载了文档解析引擎的大模型,在回答问题的速度、准确度上更胜一筹。

大模型使用文档解析引擎之前(左)和之后(右)的效果对比

技术人员介绍,金融报表、行业报告等高知识密度的文档中,表格的含义是最精华的数据指标。失之毫厘差之千里,一个单元格的理解问题,可能导致整个表格的识别结果产生误差,所以表格的还原准确率,直接影响着模型问答的效果。而大模型“加速器”中的文档解析引擎,能够对研报、论文等文档中的柱状图、折线图、饼图、雷达图等十余种常见图表进行“还原”,巧妙转化大模型能够理解的格式,使数据和图表中的信息能够被大模型充分提取、理解。

合合信息智能创新事业部总经理唐琪透露,目前,大模型“加速器”已被百川智能等多家大模型厂商应用于金融、医学、财经、媒体等多领域的文档的解析中,助力大模型更顺利地接轨“专业课”。

专业的大模型做专业的事,成为近年来国内大模型厂商逐渐达成的共识,医疗、金融等垂直行业大模型涌现,成为展区中的一大亮点。

王小川创立的大模型明星创业公司百川智能,此次也展出了其通用医疗增强大模型和AI医疗应用的最新突破。工作人员介绍,百川智能的通用医疗增强大模型不仅在USMLE(美国医考)的评测中超越了GPT-4,并且在由协和医院等头部三甲高年资主任、主治医师和心理学专家作为评测主体,对模型进行多角度评测的真实人工评测中同样超越了GPT-4。

在此基础上,团队研发了一款全新的AI医疗应用——AI健康顾问,AI健康顾问依托百川智能的通用医疗增强大模型打造,不仅拥有丰富的医药学知识,并且还具备医生思维。它能够像从业多年的全科医生一样,在用户提出问询之后,根据用户的问题持续提问,从更多维度更深入地了解症状,收集到足够多病症信息后再进行综合判断,给出诊断结果和用药建议。

比如,用户问AI健康顾问“我肚子疼,该怎么办?”,收到问题之后,AI健康顾问会相继向用户提出,“是否有呕吐、恶心、腹泻等其他的症状?是否发烧?肚子疼的具体位置?”等多个角度的问题,最后根据用户的回答综合判断病因,给出治疗建议。

面壁智能开源业内首个端侧大模型工具集、支付宝发布多模态医疗大模型、首个面向C端用户的可控人物视频生成大模型Vimi……上千种人工智能新成果在大会期间组团亮相“秀技”。

来源:北京日报客户端

记者:孙奇茹

网址:语料“加速器”、AI健康顾问,大模型上下游成果秀技 https://m.mxgxt.com/news/view/1476112

相关内容

大模型加速赋能,医渡科技上线一站式私人健康顾问平台“开心健康科技”
医渡科技(02158)大模型落地C端 一站式私人健康顾问平台“开心健康科技”上线
聚焦数字医疗丨AI大模型加速医疗行业数字化转型,应用场景会如何变化?
上海人工智能产业布局加速:构建大模型生态与人形机器人创新
百度文心大模型,何以成为AI开发者的标配基座?
字节跳动AI生态加速发展:豆包模型引领技术革新
机器人五大关键技术:伺服电机、减速器、关节、控制器与执行器
【健康顾问】英语怎么说
AI、机器人、语音助手:中国银发族的养老“新朋友”
从大模型到机器人 企业密集布局“AI+教育”

随便看看