欧洲人文和自然科学院外籍院士孙茂松:成都应探索大模型在垂直领域的应用

9月11日,第二十一届中国西部海外高新科技人才洽谈会开幕式暨天府论坛在成都召开。会上,欧洲人文和自然科学院外籍院士、清华大学人工智能研究院常务副院长孙茂松做“生成式人工智能特点、趋势及机遇”主题演讲。他认为,成都要探索人工智能在垂直领域的应用场景落地,加快孵化或吸引一批大模型相关创业团队。

生成式人工智能不会取代人类

孙茂松指出,生成式人工智能ChatGPT的核心算法是一个策略,即:下一个词预测。他以“我昨天晚上吃了饭”为例,让机器在该句中的任一位置停下来,在“我昨天晚上吃了”停,接着让机器预测下一个词是什么,机器是知道的,人工智能的算法会调动其内在机制,让机器去确定这个词是“饭”,这种“明知故问”的策略叫自监督学习,其好处在于机器可在互联网上任意规模的语料进行,并覆盖整个互联网。

“生成式人工智能的基本定位不会取代人类,它只能启发或者辅助人类,这是由它的方法特点所决定的。”他认为,其语言生成模型的性质是强大而较为准确的生成能力,属于概率式方法的范畴,但也会出现“幻觉现象”,因为机器基本不知道人的目标,产生错误也不可避免,具有不可确定性,所以人只能尽量控制它的幻觉。

“生成式人工智能解决了人与机器打交道的一大难题,以前是结构化的数据方式,人类的话语它理解不了,但现在使其成为可能,人与机器打交道的环境因它而产生某种变革,可能会导致产业和产业生态的重新洗牌。”在他看来,内容生产现已显效,并在可交互机器人、元宇宙、数字孪生等有着广泛的应用前景,它有效地提升了智力劳动的效率和质量,也对数字经济发展产生重要作用。

“大模型已成为人工智能巅峰对决的一个终极战场之一。”他还认为,大模型+大数据+大算力是生成式人工智能的三驾马车。“目前,成都大模型研发与北上广深比较相对较弱,数字经济上升空间大。”

成都可另辟蹊径盖“小房子”

何为大模型?在孙茂松看来,大模型是智能信息处理的基础设施,垂直领域要使用信息处理技术和数字化高度发达的应用场景,需要智能化时,大模型便派上用场。“以前每个应用都要搭建自己的地基和小房子,现在大模型就像一个通用的基座,类似于建了一座盖房子时使用的特别大的地基,这几乎用了人类所有的信息来搭建,这会比自己搭的更结实、更高。”他说道。

他介绍说,目前大模型有两大发展趋势,一是专注于大模型底座,事实上,目前全世界有能力做最高端的大模型的独立团队也不多,最主要集中在美国,欧洲和日本都相对较弱,现在美国的多家知名公司还在致力打地基,今年也在努力探索如何搭建“大房子”,成都现在起步已相对较晚。

二是在此基础上做大模型垂直领域的应用,“现目前国际上还没有取得特别成功的案例,这对全世界来说都是个短板”,他认为,“小房子”是就全球视野来说相对较少,规模几亿到几十亿不等,“‘搭小房子’的别人还没开始做,这对成都来说是一个机会。”他建议,成都要发挥好独特的应用场景优势,搭建不同领域的“小房子”。

“大模型也是一柄双刃剑”,他认为,“成都要盖好小房子也是有挑战性的。”他指出,目前各国都有不同的监督政策,要让生成式人工智能符合监管政策是不容易的,大模型本质上的弱点在于生成的内容不能保证其正确性,“关键在于如何运用好它,让它更好地服务人类。”孙强调。

成都又该如何盖好“小房子”?他认为,这需要大量的人才在了解地基的性能的基础上建房子。目前,成都人工智能技术发展较好,大模型是人工智能的一部分,但成都的大模型人才及相关工作相对较少且弱。他建议,“成都应尽快补齐大模型领域的人才,其川大、电子科大等高校质量很高的,成都有能力补上,过去由于历史原因,研究人工智能的人才相对少,目前已不足以支撑成都人工智能蓬勃发展的市场需求。”

孙茂松还建议,成都要发挥好人才优势,孵化或吸引打造一批大模型相关创业团队,大模型的弱点也要靠其团队发现问题、解决问题。同时,政府也要对初创企业优先给予关照,有意识地扶持大模型里面的垂直领域应用企业。(文/陈敏、彭艳)