Cohere 创始人:语音是下一代用户界面;OpenAI 开放 GPT-4o 定制新功能丨 RTE 开发者日报

随笔2周前发布 鄢君宜
5 0 0

 

Cohere 创始人:语音是下一代用户界面;OpenAI 开放 GPT-4o 定制新功能丨 RTE 开发者日报

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@SSN,@鲍勃

01 有话题的新闻

1、OpenAI 开放 GPT-4o 定制功能,企业可更轻松打造专属 AI 助手

 

OpenAI 推出了一项新功能,允许企业客户使用自己的数据来定制其最强大的 AI 模型 GPT-4o。此举旨在应对日益激烈的 AI 企业应用竞争,并满足企业对 AI 投资回报的更高要求。

 

所谓定制,即业界所称的「微调(fine-tuning)」。通过微调,现有 AI 模型可以针对特定任务或领域进行优化。例如,一家滑板公司可以微调 AI 模型,使其成为能够回答有关轮子和滑板护理问题的客服聊天机器人。

 

此前,OpenAI 仅允许用户微调其较小的模型,如 GPT-4o mini。而此次开放 GPT-4o 和 GPT-4 的微调功能,意味着企业可以更直接地优化 OpenAI 最强大的模型,无需依赖外部服务或使用性能较低的模型。OpenAI 产品主管 Olivier Godement 表示,希望通过直接与公司合作,让客户更轻松地调整其最强大的模型,简化操作流程。

 

据了解,企业需要将数据上传至 OpenAI 服务器进行模型微调,平均耗时一到两个小时。目前,微调仅支持基于文本的数据,图像等其他类型的数据暂不支持。(@IT 之家)

 

2、《黑神话:悟空》上市首日销售额超 15 亿元

 

Cohere 创始人:语音是下一代用户界面;OpenAI 开放 GPT-4o 定制新功能丨 RTE 开发者日报

 

 

8 月 20 日,《黑神话:悟空》正式上线。游戏上线后即登顶 Steam 热玩游戏榜首,同时在线游玩人数迅速突破百万大关。昨晚,根据 Steam 平台显示,《黑悟空:神话》同时在线人数突破 220 万,超过《幻兽帕鲁》,位居历史峰值人数第二,仅次于《PUBG》。

 

截至目前,《黑悟空》在 Steam 平台共收获 128888 篇评价,其中有 96%的内容为好评。在游戏上线后,针对网友反馈的页面黑屏闪退情况,游戏科学也迅速给出了解决方案。

 

此前有媒体估算,《黑神话:悟空》在 Steam 国区的售价为 268 元人民币(标准版),数字豪华版售价为 328 元人民币。根据这一定价,游戏科学至少要卖到 300 万份才能回本。而根据国游畅销榜的统计,截至昨日晚间,游戏在 Steam 上已售出超过 300 万份,加上 wegame、epic 和 ps 平台,目前总销量超过 450 万份,总销售额超过 15 亿。

 

有机构人士向财联社记者表示,看好《黑神话:悟空》对于游戏行业研发实力、游戏出海文化出海方向,以及云游戏市场的带动作用,对于该游戏的销量持乐观态度。(@APPSO)

 

3、首批万人测试已招满,OpenAI 关闭 SearchGPT 候补名单

 

OpenAI 宣布已经关闭 SearchGPT 候选名单,仅邀请 10000 人参与测试,并已经开始向未被选中参与测试的用户发送通知邮件。

 

SearchGPT 目前仅向少量用户开放,这可能有助于避免搜索机器人提供错误建议的情况。官方介绍为:「全新搜索功能原型,利用我们人工智能模型的优势,为您提供清晰、相关的快速答案」。

 

SearchGPT 可以让用户用自然语言提问,并获得详细、易懂的答案,就像在与专家交谈一样。系统能够保持对话的上下文,理解复杂的查询,甚至自己澄清细节。(@IT 之家)

 

4、Half_illustration:生成结合摄影和插画涂鸦元素的图像,一半是照片一半是插画

 

Cohere 创始人:语音是下一代用户界面;OpenAI 开放 GPT-4o 定制新功能丨 RTE 开发者日报

 

 

Half_illustration 是一个用于生成结合摄影和插画涂鸦元素的图像的模型,基于 Flux.1 模型训练。该模型擅长生成既有照片风格,又带有插画效果的独特图像。用户可以尽情发挥想象力,描述各种戏剧性的场景和动作姿势,再加上烟雾、花卉、火焰等插画元素,让作品既真实又充满想象力。只需要在描述中加上特定的关键词(比如 「in the style of TOK」),就可以更好地保持图像的风格统一。这个模型是通过从 Pinterest 上收集的图片训练出来的。

 

Half_illustration 广泛应用于时尚摄影、广告设计、市场营销等领域。它不仅提供了 API 接口,还和流行的 Diffusers 库兼容。(@小互 AI)

 

5、中国首个接入大模型的 Linux 开源操作系统正式发布,Linux 发行版 deepin V23

 

知名开源社区 deepin(深度)社区正式对外发布了开源操作系统,Linux 发行版 deepin V23。deepin V23 搭载 Linux 6.6 LTS 内核,全新 DDE,深度融合 AI 能力,并带来了「如意玲珑」独立包工具集、自研 deepin IDE、原子更新在内的 200 余个产品优化和新增功能。

 

作为中国首个开源操作系统根社区推出的发行版本,deepin V23 真正实现了操作系统在仓库、应用层、操作系统核心组件上都有自研模块,向全球开源爱好者输出提供优异的源自中国的开发套件。

 

在应用层,已支持自然语言命令调用 20 多个操作系统设置能力、40 多个使用场景;

 

在芯片层,支持国内主流 CPU 芯片和英伟达等国内外主流 GPU 芯片;

 

大模型层开放接口,支持接入所有 OpenAI 接口格式的大模型,用户可根据自身需求,自行适配专属模型。(@腾讯研究院)

02 有态度的观点

1、Cohere 创始人:语音是下一代用户界面;仅通过销售模型,很快变成「零利润业务」

 

人工智能(AI)技术的商业模型正在快速变化,这是由 Cohere 的创始人 AidanGomez 在最近一次播客中提出的论点。他指出,目前像 OpenAI 和 Anthropic 这样的公司每年在训练如 GPT-4 和 Claude 这样的模型上花费数十亿美元,但由于激烈的价格竞争,围绕这些平台的商业变得相当不稳定。

 

Gomez 认为,仅仅通过销售模型,即向开发者提供 API 接口访问 AI 模型,将很快变成一个「零利润业务」。尽管这些 AI 模型的需求在迅速增长,但由于价格战,利润空间将变得非常有限。

 

Cohere 作为 Al 模型的提供商,也面临着类似的挑战。Gomez 提到,尽管 Cohere 的 AI 模型在长期内将是一个有吸引力的业务,但在短期内,通过产品化可能是实现收入的更有意义的方式。

 

他强调,目前 AI 模型的成本远远超过了它们所产生的收益,而像微软和谷歌这样的大公司可能能够承受或简单地经受住这种损失,但对于初创公司来说,情况并非如此。

 

此外,大型科技公司在初创公司有机会成为竞争对手之前,就已经开始」吞噬」这些新兴公司。Gomez 警告说,成为云服务提供商的子公司是非常危险的,因为风险投资人可能只想要一个不错的回报,而云服务提供商可能想要更多。

 

在这种竞争激烈的环境下,开发前沿 AI 模型的公司面临着越来越大的挑战。虽然有传言称,模型架构、数据效率或计算能力的创新将为这些 AI 模型带来巨大的回报,但没有人知道这一天何时或是否会到来。显然,并非今天的每家 AI 初创公司都能看到那一天。

 

问及语音是否是下一个消费者界面,Gomez 认为:「绝对是的,与模型进行语音对话是一个非常好的体验,模型展示情感、语调、呼吸声、嘴唇的声音,这些都让人印象深刻。」(@Memo)

 

2、谷歌高级工程师:AGI 的进展已经停滞,因为 LLMs 缺乏系统 2 思维

 

François Chollet 是谷歌高级软件工程师,Keras 深度学习库的创建者,也是《用 Python 深度学习》的作者,该书通过直观的解释和实践示例来帮助理解深度学习,他在人工智能领域成果显著。

 

François Chollet 探讨了有关 AGI 的问题,介绍了语言模型存在的问题,如对措辞敏感、泛化能力有限等,指出语言模型的性能依赖任务熟悉度而非复杂度,提出衡量智能的关键概念,如静态技能与流体智能等。Chollet 提出,尽管大实验室正在训练更大的语言模型,但这些模型缺乏深思熟虑的推理能力,即系统 2 思维,这导致了通用人工智能发展的停滞。系统 2 思维源自 Daniel Kahnemann 的理论,指的是有意识、深思熟虑的推理过程。(@雷锋网)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

Cohere 创始人:语音是下一代用户界面;OpenAI 开放 GPT-4o 定制新功能丨 RTE 开发者日报

 

素材来源官方媒体/网络新闻

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...