12

2023-11

斯坦福提出对比偏好学习:无需强化学习即可从人类反馈中学习

在模型与人类意图对齐方面,根据人类反馈的强化学习(RLHF)已经成为一大流行范式。通常来说,RLHF 算法的工作过程分为两个阶段:一、使用人类偏好学习一个奖励函数;二、通过使用强化学习优化所学习的奖励来对齐模型。 RLHF 范式假定人类偏好的分布遵照奖励,但...

02

2023-10

英伟达GPU囤太多 科技巨头赚不出2000亿美元?红杉与AI大佬激辩

来源:财联社 编辑 黄君芝 图片来源:由无界 AI‌ 生成 今年以来,在人工智能(AI)的推动下,美股大幅反弹,科技股也“重振雄风”,还形成了包括微软和英伟达在内的“七巨头”。一切似乎都看起来非常美好,然而需要注意的是,目前真正从AI身上捞到钱的只有...

02

2023-10

打通谷歌办公软件,Bard与ChatGPT走差异化道路

时隔半年,曾被ChatGPT吊打的Bard发布重磅更新,打通了Gmail、Docs等谷歌办公应用全家桶的数据,支持一键转存AIGC内容至谷歌系的邮箱、文档、表格等应用程序中,还在对话页面加入“Google it”自核实功能,避免对话机器人的幻觉Bug。 事实上,Bard上线后一直在迭代...

02

2023-10

回应 OpenAI 的挑战,Midjourney 将在今年发布 V6 版本升级

距离 Midjourney v5 发布已经过去了半年时间,下一个重大版本 v6 什么时候发布?答案是:今年晚些时候。 Midjourney 首席执行官 David Holz 在昨日的活动中表示,Midjourney v5 到 v6 的飞跃将大于 v4 到 v5 的飞跃。不过,Holz 没有给出确切的发布日期,但表示很...

02

2023-10

投资 40 亿美元,亚马逊选择 Anthropic 硬刚 OpenAI

图片来源:由无界 AI 生成 微软又发布 AI 新品了、谷歌又出大模型了、Meta 又开源 AI 模型了.....这些科技巨头接二连三地出现在科技头条,但有一个科技巨头始终保持低调,但现在他要开始走出幕后了。亚马逊 40 亿美元投资了 AI 初创公司 Anthropic,使其融资...

02

2023-10

如何给生成式AI产品定价

原文来源:深思SenseAI 图片来源:由无界 AI‌ 生成 对于生成式 AI 产品的定价策略目前大家似乎都处在摸索期,我们之前解读的 PLG 产品增长策略中提出了 Freemium 等几种定价策略,而妙鸭相机则上线第一天就收费。对于生成式 AI 产品应该如何定价?曾在 YC 担...

02

2023-10

大模型可解释性你能理得清吗?综述已来,一文解你疑惑

图片来源:由无界 AI 生成 大规模语言模型在自然语言处理方面展现出令人惊讶的推理能力,但其内在机理尚不清晰。随着大规模语言模型的广泛应用,阐明模型的运行机制对应用安全性、性能局限性和可控的社会影响至关重要。 近期,中美多家研究机构(新泽西理...

02

2023-10

数据标注员,困在大模型里

在一家互联网大厂做数据标注的小颜,时常在公司感到一种隔绝。 小颜的工位,跟产品经理、程序员们挨在一起,他们能享受相同的福利:同样的工牌、苹果电脑;随时可以去健身房,或去太空舱睡一觉。 但小颜能察觉到,作为数据标注员的她和其他同事,分属于“两个世...

02

2023-10

280 亿!亚马逊投了 OpenAI 最大敌人

图片来源:由无界 AI生成 9 月 25 日下午,亚马逊在公司官网公布,向大模型公司 Anthropic 投资至多 40 亿美元,后者以拥有对标 ChatGPT 的聊天机器人 Claude 而闻名。 云计算公司大笔投资大模型公司,微软已经在今年 2 月开了个好头,以 100 亿美元获得 O...

02

2023-10

阿里140亿大模型开源!10项任务超340亿Llama 2,Demo在线可玩

阿里又开源大模型了! 这次是纯粹的大语言模型,相比上一次的70亿,新模型的参数量来到了140亿。 它名叫Qwen-14B,一上来就在一系列任务榜单中全部取得了第一,直接超过了Meta的340亿参数Llama 2版本。 Qwen-14B的训练数据达到3万亿tokens,不仅中英文都来...

登录后才能复制或下载网站内容