当前位置:首页 > 娱乐 > 财经观察:提升人机交互效率 多模态大模型易用性进一步推进

财经观察:提升人机交互效率 多模态大模型易用性进一步推进

2025-12-16 23:11:09 [休闲] 来源:柳州市某某计算机维修网点

人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态长治市某某电子商务培训学校问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经长治市某某电子商务培训学校音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

(责任编辑:休闲)

推荐文章
  • 四代嘉宅筑就热销现象 革新怀柔好房子标准的划时代范本

    四代嘉宅筑就热销现象 革新怀柔好房子标准的划时代范本 何为真正的“好房子”?在新时代的发展进程中,“好房子”已从简单的居住概念成为重要的民生议题与发展命题。国家层面明确提出,要建设“安全、舒适、绿色、智慧”的好房子,这不仅是对建筑品质的要求,更是对美好生 ...[详细]
  • 昆明长丰学校食堂承包商被罚578万

    昆明长丰学校食堂承包商被罚578万 原标题:昆明长丰学校食堂承包商被罚578万) 10月16日,云南昆明官渡区长丰学校食堂疑提供变质肉给学生食用,引发家长们集体不满,家长指责学校食堂“整盆肉都是臭的 ...[详细]
  • 癌症患者每天揉这里5分钟,对康复好!

    癌症患者每天揉这里5分钟,对康复好! 焦躁、心烦易怒、失眠,甚至伴随心慌心悸等 ,这是笔者临床接诊肿瘤患者,普遍大家都共有的一些情况。那除了由于疾病本身引起的,还与药物副作用,以及患者个体情绪差异相关。而这些症状又都与“心”有些联系。学会 ...[详细]
  • 委内瑞拉拘留3名涉嫌从事恐怖活动的美国人

    委内瑞拉拘留3名涉嫌从事恐怖活动的美国人   当地时间10月17日,委内瑞拉内政和司法部长卡韦略表示,有3名美国人因涉嫌从事恐怖活动被拘留。总台记者 马天静) ...[详细]
  • 首度公开!航天技术骨干炒股亏空,竟向间谍……

    首度公开!航天技术骨干炒股亏空,竟向间谍……   科研工作者因其岗位的特殊性与接触信息的敏感性,往往处于反窃密、防泄密斗争的前沿。他们掌握的不仅是最新科技成果,更是国家核心利益的重要组成部分。然而,当个人选择出现偏差,这些佼佼者也可能走上危害国家 ...[详细]
  • 伊朗警告以色列,美国“萨德”反导系统并不可靠

    伊朗警告以色列,美国“萨德”反导系统并不可靠   美国媒体日前报道称,以色列袭击伊朗的计划已准备就绪。而美国提供给以色列的“萨德”反导系统也已经抵达。伊朗伊斯兰革命卫队总司令萨拉米10月17日再次警告称,如果以色列袭击伊朗目标,伊朗将采取进一步报 ...[详细]
  • 天津楼市大消息!专家:具有非常强的信号意义

    天津楼市大消息!专家:具有非常强的信号意义 天津楼市 每日经济新闻资料图  “煎饼果子自由,买房也自由了。”  10月16日,据天津市住建委消息,天津将对楼市进一步松绑,取消住房限制性措施,进一步优化房地产政策,取消新建商品住房和二手住房购买、 ...[详细]
  • 【喂饭专题直接背】沉默的螺旋

    【喂饭专题直接背】沉默的螺旋 @TuTouSuo™️ *小红书账号:秃头研究所新传考研/秃头研究所Monsters*传播学、新闻学、网络传播与前沿热点专题定期定量喂饭!!!后台回复「息流」可直接获得所有喂饭内容PDF可打印版!!! ...[详细]
  • 国子监二期腾退圆满收官:退租签约率约51%

    国子监二期腾退圆满收官:退租签约率约51% 初冬的国子监街,红墙绿瓦映着稀薄的阳光。随着11月30日政策宣讲期结束,持续近三个月的国子监二期腾退项目正式落下帷幕。165个院落、1419户居民,最终以51%的签约率为这个东城区2025年重点城市更 ...[详细]
  • 曼联大裁员,裁到了82岁的弗格森头上...

    曼联大裁员,裁到了82岁的弗格森头上... 尽管在球场上举步维艰,但在球场下,曼联的一系列骚操作无疑遥遥领先于其余19支英超对手。今年7月,当英国媒体报道曼联为了节省开支,将裁掉超过250名员工时,恐怕再疯狂的人也不会想到,仅仅三个月后,曼联的 ...[详细]