用多少语言来赞誉Sam Altman的营销能力和超强的节奏感都不为过,Sam在各种渠道接受访谈时的烟雾弹和欲说还休终于在今天凌晨的Open AI春季发布会中尘埃落定。
另外,这周🐑了,公众号更不太动,深刻的感受到身体健康才是革命的本钱,要多多保重身体。
言归正传,虽然没有出现在发布会上,但Sam Altman还是更新了博客High light了GPT-4o,他上次更新Blog还在5个月前,可见这次发布会的特殊意义。
今天的公告中,我想特别强调两点。
首先,我们的使命核心是向人们免费(或以极为优惠的价格)提供功能强大的 AI 工具。我非常自豪我们能够通过 ChatGPT 免费向大家提供全球最优秀的模型,而且不含任何广告或其他干扰。
当 OpenAI 刚成立时,我们的初衷是创造 AI,并利用它为世界带来种种益处。但现实似乎是,我们创造了 AI,而其他人会利用它创造出让我们所有人受益的惊人事物。
作为一家商业公司,我们会找到很多收费的机会,这将帮助我们为(希望能达到)数十亿人提供免费、卓越的 AI 服务。
其次,新推出的语音(及视频)模式是我所体验过的最佳计算机界面。它给人一种仿佛来自电影中的 AI 的感觉;对我来说,这种真实存在的体验仍旧让人略感惊讶。实现人类水平的响应速度和表现力,标志着一个巨大的转变。
最初的 ChatGPT 给我们展示了语言界面的潜力;而这个新东西,给人的感觉截然不同。它快速、智能、有趣、自然且有用。
以前,我从未觉得与计算机对话能这么自然;但现在,我有了这种感觉。随着我们添加(可选的)个性化功能、访问个人信息、代表用户采取行动等功能,我真的可以预见一个激动人心的未来,在这个未来中,我们能够利用计算机完成以前从未想象过的更多事情。
最后,非常感谢那些为此付出巨大努力的团队成员!
OpenAI是一家既擅长市场营销(全靠Sam一张嘴)、又具有产品力(ChatGPT无疑是最快找到PMF的产品)、还技术超强(Foundation Model还未被超越)的企业,我们看下OpenAI在商业、技术和产品上分别带来了什么。
技术
Foundation Model就是技术的全部,这次发布会的主角是GPT-4o。GPT-4o是一个融合了音频、视觉(视频、图片)、文本的多模态的基础模型。
并且,从用户语音输入到AI语音反馈平均的推理延时低至320ms,这已经达到了人类的水平。
就像Sam在博客中说的,实时将带来一种全新的人机互动范式,而且她/他现在还可以看见你、听到你。
产品
OpenAI把去年12月份Google吹过的牛,给完完整整的做出来了,并且还都在发布会上实实在在的演示了一遍ChatGPT-4o。
与ChatGPT-4o语音通话时,他/她可以观察到多个发言方,可以感知情绪、给出不同音色、音调笑声甚至唱歌反馈;可以随时打断或者插话、还会多国语言。
语音通话的演示太震撼了,我在文末放了发布会的视频链接,拖到9分45秒,去看看Jarvis、Moss、Her这些你在科幻小说或电影中看过的场景中在现实中降临。看到Hume.ai时已经连连感叹效果离谱,这次ChatGPT-4o的效果简直离谱到家了。
想想当年自己做智能语音客服的时候,极尽雕花手段来实现打断,配置打断意图、开场不可打断,打断后续播等等效果还只能说差强人意,这些奇技淫巧在算力的暴力美学下只能说毫无意义。既然端到端才是王道,是不是还可以赌一把Tesla的股票。
商业
OpenAI一直C端和B端并举,C端直接出了免费这个大招,免费用户默认启用 GPT-4o,但会有用量的限制,后续持续看好梯子和账号产业。
另外,GPT-4o将两三周后优先给到Plus用户体验,所以已经退订的你是不是又续订上了。
B端的API也给出2倍速度并且半价的策略。关于成本分享一个段子,采用AI替代客服时ChatGPT消耗的成本和直接雇佣印度客服的日薪相当,所以成本才是阻碍应用爆发的关键因素。
最后
场外专家表示之前扑朔迷离的gpt2-chatbot本尊就是GPT-4o,抛开推理过程机器味比较重外,能力真是没得说。
OpenAI发布会的日子选在Google I/O的前一天,也真是司马昭之心真是路人皆知了,期待Google今晚将打出什么牌来应对。
当然发布会还是有些小遗憾,那就是一年多过去了,GPT-5去哪了?Q*又是什么?这两位主角的缺失也许才是盘后NVDA股价稳定的原因吧?
本文链接:https://gpt5.fans/chatgpt5_47.html
GPT-4oGPT4ogpt-4o检测人的情绪gpt-4o多模态大模型发布GPT-4o免费GPT-4o官网GPT4o官网
网友评论