ainews-the-top-ai-engineer
**AI 工程全集,尽在此处** (也可以翻译为:**AI 工程一站式汇总**)
即将于 6 月 25 日至 27 日在旧金山举行的 AI 工程师世界博览会 (AI Engineer World’s Fair) 将采用显著扩大的活动形式,届时将有来自 OpenAI、DeepMind、Anthropic、Mistral、Cohere、HuggingFace 和 Character.ai 等顶尖模型实验室的展位、演讲和研讨会。此外,微软 Azure、亚马逊 AWS、谷歌 Vertex 以及 英伟达 (Nvidia)、Salesforce、万事达卡 (Mastercard)、派拓网络 (Palo Alto Networks) 等各大公司也将参与其中。
本次活动涵盖 9 个主题方向,包括 RAG(检索增强生成)、多模态、评估/运维 (evals/ops)、开源模型、代码生成、GPU、智能体 (agents)、财富 500 强中的 AI,以及新增的 AI 领导力方向。
此外,Anthropic 分享了关于 Claude 3 Sonnet 的可解释性研究,揭示了数百万个可引导的可解释特征,这些特征可用于修改模型行为,包括与偏见和不安全内容相关的安全特征,不过其实际应用仍需进一步研究。该活动还为 AI News 的读者提供了折扣码。
Deep IRL networks 是你唯一需要的!6 月 25-27 日在旧金山。
2024/5/21-2024/5/22 AI 新闻。 我们为您检查了 7 个 subreddits、384 个 Twitter 账号 和 29 个 Discord(380 个频道和 7699 条消息)。 预计节省阅读时间(以 200wpm 计算):805 分钟。
有很多非技术性新闻——加州参议院通过了 SB 1047,关于 Vox 报道的 OpenAI 员工合同 和 安全派辞职 的更多爆炸性新闻,虽然 Mistral v0.3 已发布,但目前还没有评估报告或博客文章可供讨论。
鉴于今天是技术上的平静日,我们借此机会分享 AI Engineer World’s Fair 首批演讲者名单 的公告!
摘要:我们为 AI News 读者提供一次性折扣:点击此处 并在周五结束前输入
AINEWS:)

AI Engineer World’s Fair (6 月 25-27 日在旧金山)
首届峰会好评如潮,现在的新形式规模扩大了 4 倍,包含展位、演讲和研讨会,参与方包括:
- 顶级模型实验室 (OpenAI, DeepMind, Anthropic, Mistral, Cohere, HuggingFace, Adept, Midjourney, Character.ai 等)
- 三大云厂商 (Microsoft Azure, Amazon AWS, Google Vertex)
- 将 AI 投入生产的大型公司 (Nvidia, Salesforce, Mastercard, Palo Alto Networks, AXA, Novartis, Discord, Twilio, Tinder, Khan Academy, Sourcegraph, MongoDB, Neo4j, Hasura 等)
- 设定议程的颠覆性初创公司 (Modular 即 Chris Lattner, Cognition 即 Devin, Anysphere 即 Cursor, Perplexity, Groq, Mozilla, Nous Research, Galileo, Unsloth 等)
- AI Engineer 领域的顶级工具 (LangChain, LlamaIndex, Instructor, Weights & Biases, Lambda Labs, Neptune, Datastax, Crusoe, Covalent, Qdrant, Baseten, E2B, Octo AI, Gradient AI, LanceDB, Log10, Deepgram, Outlines, Unsloth, Crew AI, Factory AI 等等)
涵盖 9 个演讲方向:RAG、Multimodality、Evals/Ops(新增!)、Open Models(新增!)、CodeGen、GPUs(新增!)、Agents、AI in the Fortune 500(新增!),以及首次设立的专门面向 AI 副总裁的 AI Leadership 方向,还有 50 多场研讨会和展览会议,涵盖了所有 AI 工程主题。当然,最重要的方向是未列出的:走廊交流 (hallway track),我们对此投入了大量心血,但在发生之前无法描述。
为了庆祝 World’s Fair 的启动,我们为 AI News 读者提供一次性折扣:点击此处 并在周五结束前输入 AINEWS :)
如果这里或 Latent Space 的内容与你的兴趣具有最高的余弦相似度 (cosine similarity),那么这个会议就是为你量身定制的。6 月 25-27 日旧金山见!
AI Twitter 综述
所有综述均由 Claude 3 Opus 完成,从 4 次运行中选取最佳。我们正在尝试使用 Haiku 进行聚类和流程工程 (flow engineering)。
Anthropic 关于 Claude 3 Sonnet 的可解释性研究
- 提取可解释特征:@AnthropicAI 使用字典学习从 Claude 3 Sonnet 的激活值中提取了数百万个可解释的“特征”,这些特征对应于模型学到的抽象概念。许多特征是多语言和多模态的。
- 通过特征引导修改行为:@AnthropicAI 发现,在前向传播过程中对这些特征进行干预(“特征引导”)可以以与特征含义相关的可解释方式,可靠地修改模型的行为和输出。
- 安全相关特征:@AnthropicAI 识别出许多与令人担忧的能力或行为相对应的“安全相关”特征,例如不安全代码、偏见、不诚实、权力寻求以及危险/犯罪内容。激活这些特征可能会诱导模型表现出这些行为。
- 初步工作,仍需更多研究:@AnthropicAI 指出这项工作是初步的,虽然这些特征似乎与安全应用有合理的关联,但仍需要大量工作来建立实际效用。
- 可解释性团队招聘:@AnthropicAI 正在为其可解释性团队招聘经理、研究科学家和研究工程师,以进一步推进这项工作。
Microsoft 的 Phi-3 模型
- Phi-3 小型和中型模型发布:@_philschmid 宣布 Microsoft 已在 MIT 许可证下发布了 Phi-3 small (7B) 和 medium (14B) 模型,其 instruct 版本支持高达 128k 的上下文。
- 表现超越 Mistral, Llama, GPT-3.5:@_philschmid 声称 Phi-3 small 在基准测试中优于 Mistral 7B 和 Llama 3 8B,而 Phi-3 medium 的表现则优于 GPT-3.5 和 Cohere Command R+。
- 训练细节:@_philschmid 指出这些模型是在 4.8 万亿个 token 上训练的,包括合成数据和过滤后的公开数据集,并支持多语言,通过 SFT 和 DPO 进行了微调。目前尚未发布基座模型。
- Phi-3-Vision 模型:Microsoft 还发布了拥有 4.2B 参数的 Phi-3-vision,@rohanpaul_ai 指出它在视觉推理任务上优于 Claude-3 Haiku 和 Gemini 1.0 Pro V 等更大规模的模型。
- 基准测试与微调:许多人渴望对 Phi-3 模型进行基准测试,并可能针对特定应用进行微调,尽管 @abacaj 指出在对话模型上进行微调有时会导致性能比基座模型更差。
Perplexity AI 与 TakoViz 合作开展知识搜索
- 使用 TakoViz 进行先进知识搜索:@perplexity_ai 宣布与 TakoViz 建立合作伙伴关系,为 Perplexity 用户带来先进的知识搜索和可视化功能,允许他们搜索、对比并分享权威的知识卡片。
- 权威数据提供商:@perplexity_ai 指出 TakoViz 的知识来源于权威数据提供商,其不断增长的索引涵盖了金融、经济和地缘政治数据。
- 交互式知识卡片:@AravSrinivas 解释说,用户现在可以提示 Perplexity 比较特定时间段内的股票价格或贷款等数据,并返回交互式知识卡片。
- 超越摘要功能:@AravSrinivas 表示,这使得 Perplexity 能够超越简单的摘要,实现跨时间线的细粒度数据查询,现在通过单个搜索栏即可完成。
- 对合作的热情:@AravSrinivas 表达了他对与 TakoViz 团队合作并参与其种子前轮融资的热爱,并提到了他们的客户至上精神以及这次集成将为 Perplexity 用户带来的价值。
杂项
- Karina Nguyen 加入 OpenAI:@karinanguyen_ 宣布在 Anthropic 工作 2 年后离职并加入 OpenAI 担任研究员,分享了关于 AI 进展、文化和个人成长的经验教训。
- Suno 为 AI 音乐融资 1.25 亿美元:@suno_ai_ 宣布融资 1.25 亿美元,旨在构建能够增强音乐制作中人类创造力的 AI,并正在招聘音乐创作者、音乐爱好者和技术专家。
- Yann LeCun 谈 LLMs 与下一代 AI:@ylecun 建议对构建下一代 AI 系统感兴趣的学生不要研究 LLMs,暗示他本人正在研究替代方案。
- Mistral AI 发布新的 Base 和 Instruct 模型:@_philschmid 分享了 Mistral AI 发布了新的 7B Base 和 Instruct 模型,具有扩展的 32k 词汇量、function calling 支持以及 Apache 2.0 许可证。
- Cerebras 和 Neural Magic 实现稀疏 LLMs:@slashML 分享了来自 Cerebras 和 Neural Magic 的论文,关于实现稀疏的基础 LLMs,以实现更快、更高效的预训练和推理。
AI Reddit 回顾
涵盖 r/LocalLlama, r/machinelearning, r/openai, r/stablediffusion, r/ArtificialInteligence, /r/LLMDevs, /r/Singularity。评论抓取功能现已上线,但仍有很大改进空间!
AI 模型发布与基准测试
- 微软在 MIT 许可证下发布 Phi-3 模型:在 /r/LocalLLaMA 中,微软已在 Huggingface 上以 MIT 许可证发布了 Phi-3 small (7B) 和 medium (14B) 模型,包括 128k 和 4-8k 上下文版本以及一个视觉模型。
- Phi-3 模型已集成到 llama.cpp 和 Ollama:Phi-3 模型已被 添加到 llama.cpp 和 Ollama 框架中,基准测试显示它们在 7-14B 参数范围内的表现优于其他模型。
- Meta 可能不会开源 400B 模型:根据 /r/LocalLLaMA 上的一位爆料者,Meta 可能会违背之前的迹象,不开源其 400B 模型,这会让许多人感到失望。
- 基准测试比较了 17 个 LLM 在 NL to SQL 上的表现:/r/LocalLLaMA 上发布的一项全面基准测试 比较了包括 GPT-4 在内的 17 个 LLM 在自然语言转 SQL (NL to SQL) 任务上的表现,GPT-4 在准确性和成本方面领先,但不同托管平台的性能差异显著。
AI 硬件与计算
- 微软为主流 PC 引入 NPU:微软宣布 神经网络处理单元 (NPU) 将成为主流 PC 处理 AI 工作负载的标配,新款 Surface 笔记本电脑将提供 独有的 64GB RAM 选项以支持大模型。
- M.2 和 PCIe NPU 加速器概览:/r/LocalLLaMA 上的一篇综述 探讨了目前 M.2 和 PCIe NPU 加速卡的情况,指出大多数加速卡在内存带宽方面仍落后于 GPU,但该领域正在迅速发展。
AI 担忧与监管
- 欧洲通过《AI 法案》监管 AI 开发和使用:欧盟已通过全面的《AI 法案》(AI Act),该法案将 从 2026 年开始监管 AI 系统的开发和使用,并可能影响全球的监管趋势。
- 加州参议院通过 AI 安全与创新法案:加州参议院通过了 SB1047 法案以促进 AI 安全与创新,反应褒贬不一,一些人担心这会限制该州的 AI 进步。
- TED 负责人称 Meta 开源 AI 是“鲁莽的”:TED 负责人 Chris Anderson 称 Meta 开源 AI 模型是“鲁莽的”,对于 AI 进步的倡导者来说,这样一位有影响力的人物持此立场令人担忧。
AI 助手与 Agent
- 微软推出 Copilot AI Agent 功能:微软宣布了 Copilot 的新 Agent 功能,它们可以 充当虚拟员工,早期预览展示了其自动化复杂工作流的能力。
- 演示展示了实时多模态 AI 游戏 Agent:/r/singularity 上发布的一个演示 展示了 实时多模态 AI Agent 如何通过视觉感知游戏状态并提供战略指导来辅助视频游戏。
- 关于亚马逊 AI 助手缺乏进展的疑问:/r/singularity 讨论了亚马逊在 AI 助手方面相对于其他科技巨头明显的进展不足,考虑到他们通过 Alexa 拥有的广泛消费者覆盖面,这一点令人费解。
Meme 与幽默
- Meme 凸显 AI 的飞速进展:关于 AI 进步的飞快速度、各大公司夸张的宣称以及对先进 AI 系统的担忧,各种 Meme 和笑话广为流传。
AI Discord 摘要回顾
摘要之摘要的摘要
- LLM 基准测试与性能优化:
- 微软的 Phi-3 Models 提供了高上下文长度和强劲性能,引发了关于基准测试和内存使用的讨论,但也发现了在 llama.cpp 等工具中的兼容性问题。
- 讨论了如 torch.compile 和特定 GPU 设置等各种优化计算效率的技术,并通过 tensor 重塑示例等见解进行了分享。
- 开源 AI 工具与框架:
- Axolotl 框架成为微调 Llama 和 Mistral 等模型的首选,其 Docker 设置简化了使用(快速入门指南)。
- LlamaIndex 引入了文档解析和批处理推理技术,集成了 GPT-4o 的能力,以增强复杂文档处理和查询准确性。
- AI 立法与社区响应:
- 加利福尼亚州的 SB 1047 法案引发了关于新规对开源模型影响的激烈辩论,人们担心这会扼杀创新并偏袒主要的既得利益者。
- 围绕 AI 语音复制产生了伦理和法律问题的讨论,特别是 OpenAI 争议性地模仿 Scarlett Johansson 的声音,在公众强烈反对后随后将其移除。
- 新型 AI 模型发布与分析:
- 实际 AI 实现与挑战:
完整的频道细分内容已在邮件中截断。
如果您喜欢 AInews,请分享给朋友!预先感谢!