Deep IRL networks 是你唯一需要的！6 月 25-27 日在旧金山。

2024/5/21-2024/5/22 AI 新闻。我们为您检查了 7 个 subreddits、384 个 Twitter 账号和 29 个 Discord（380 个频道和 7699 条消息）。预计节省阅读时间（以 200wpm 计算）：805 分钟。

有很多非技术性新闻——加州参议院通过了 SB 1047，关于 Vox 报道的 OpenAI 员工合同和安全派辞职的更多爆炸性新闻，虽然 Mistral v0.3 已发布，但目前还没有评估报告或博客文章可供讨论。

鉴于今天是技术上的平静日，我们借此机会分享 AI Engineer World’s Fair 首批演讲者名单的公告！

摘要：我们为 AI News 读者提供一次性折扣：点击此处 并在周五结束前输入 AINEWS :)

AI Engineer World’s Fair (6 月 25-27 日在旧金山)

首届峰会好评如潮，现在的新形式规模扩大了 4 倍，包含展位、演讲和研讨会，参与方包括：

顶级模型实验室 (OpenAI, DeepMind, Anthropic, Mistral, Cohere, HuggingFace, Adept, Midjourney, Character.ai 等)
三大云厂商 (Microsoft Azure, Amazon AWS, Google Vertex)
将 AI 投入生产的大型公司 (Nvidia, Salesforce, Mastercard, Palo Alto Networks, AXA, Novartis, Discord, Twilio, Tinder, Khan Academy, Sourcegraph, MongoDB, Neo4j, Hasura 等)
设定议程的颠覆性初创公司 (Modular 即 Chris Lattner, Cognition 即 Devin, Anysphere 即 Cursor, Perplexity, Groq, Mozilla, Nous Research, Galileo, Unsloth 等)
AI Engineer 领域的顶级工具 (LangChain, LlamaIndex, Instructor, Weights & Biases, Lambda Labs, Neptune, Datastax, Crusoe, Covalent, Qdrant, Baseten, E2B, Octo AI, Gradient AI, LanceDB, Log10, Deepgram, Outlines, Unsloth, Crew AI, Factory AI 等等)

涵盖 9 个演讲方向：RAG、Multimodality、Evals/Ops（新增！）、Open Models（新增！）、CodeGen、GPUs（新增！）、Agents、AI in the Fortune 500（新增！），以及首次设立的专门面向 AI 副总裁的 AI Leadership 方向，还有 50 多场研讨会和展览会议，涵盖了所有 AI 工程主题。当然，最重要的方向是未列出的：走廊交流 (hallway track)，我们对此投入了大量心血，但在发生之前无法描述。

为了庆祝 World’s Fair 的启动，我们为 AI News 读者提供一次性折扣：点击此处 并在周五结束前输入 AINEWS :)

如果这里或 Latent Space 的内容与你的兴趣具有最高的余弦相似度 (cosine similarity)，那么这个会议就是为你量身定制的。6 月 25-27 日旧金山见！

目录和 Discord 摘要已移至此邮件的网页版：！

AI Twitter 综述

所有综述均由 Claude 3 Opus 完成，从 4 次运行中选取最佳。我们正在尝试使用 Haiku 进行聚类和流程工程 (flow engineering)。

Anthropic 关于 Claude 3 Sonnet 的可解释性研究

提取可解释特征：@AnthropicAI 使用字典学习从 Claude 3 Sonnet 的激活值中提取了数百万个可解释的“特征”，这些特征对应于模型学到的抽象概念。许多特征是多语言和多模态的。
通过特征引导修改行为：@AnthropicAI 发现，在前向传播过程中对这些特征进行干预（“特征引导”）可以以与特征含义相关的可解释方式，可靠地修改模型的行为和输出。
安全相关特征：@AnthropicAI 识别出许多与令人担忧的能力或行为相对应的“安全相关”特征，例如不安全代码、偏见、不诚实、权力寻求以及危险/犯罪内容。激活这些特征可能会诱导模型表现出这些行为。
初步工作，仍需更多研究：@AnthropicAI 指出这项工作是初步的，虽然这些特征似乎与安全应用有合理的关联，但仍需要大量工作来建立实际效用。
可解释性团队招聘：@AnthropicAI 正在为其可解释性团队招聘经理、研究科学家和研究工程师，以进一步推进这项工作。

Microsoft 的 Phi-3 模型

Phi-3 小型和中型模型发布：@_philschmid 宣布 Microsoft 已在 MIT 许可证下发布了 Phi-3 small (7B) 和 medium (14B) 模型，其 instruct 版本支持高达 128k 的上下文。
表现超越 Mistral, Llama, GPT-3.5：@_philschmid 声称 Phi-3 small 在基准测试中优于 Mistral 7B 和 Llama 3 8B，而 Phi-3 medium 的表现则优于 GPT-3.5 和 Cohere Command R+。
训练细节：@_philschmid 指出这些模型是在 4.8 万亿个 token 上训练的，包括合成数据和过滤后的公开数据集，并支持多语言，通过 SFT 和 DPO 进行了微调。目前尚未发布基座模型。
Phi-3-Vision 模型：Microsoft 还发布了拥有 4.2B 参数的 Phi-3-vision，@rohanpaul_ai 指出它在视觉推理任务上优于 Claude-3 Haiku 和 Gemini 1.0 Pro V 等更大规模的模型。
基准测试与微调：许多人渴望对 Phi-3 模型进行基准测试，并可能针对特定应用进行微调，尽管 @abacaj 指出在对话模型上进行微调有时会导致性能比基座模型更差。

Perplexity AI 与 TakoViz 合作开展知识搜索

使用 TakoViz 进行先进知识搜索：@perplexity_ai 宣布与 TakoViz 建立合作伙伴关系，为 Perplexity 用户带来先进的知识搜索和可视化功能，允许他们搜索、对比并分享权威的知识卡片。
权威数据提供商：@perplexity_ai 指出 TakoViz 的知识来源于权威数据提供商，其不断增长的索引涵盖了金融、经济和地缘政治数据。
交互式知识卡片：@AravSrinivas 解释说，用户现在可以提示 Perplexity 比较特定时间段内的股票价格或贷款等数据，并返回交互式知识卡片。
超越摘要功能：@AravSrinivas 表示，这使得 Perplexity 能够超越简单的摘要，实现跨时间线的细粒度数据查询，现在通过单个搜索栏即可完成。
对合作的热情：@AravSrinivas 表达了他对与 TakoViz 团队合作并参与其种子前轮融资的热爱，并提到了他们的客户至上精神以及这次集成将为 Perplexity 用户带来的价值。

杂项

Karina Nguyen 加入 OpenAI：@karinanguyen_ 宣布在 Anthropic 工作 2 年后离职并加入 OpenAI 担任研究员，分享了关于 AI 进展、文化和个人成长的经验教训。
Suno 为 AI 音乐融资 1.25 亿美元：@suno_ai_ 宣布融资 1.25 亿美元，旨在构建能够增强音乐制作中人类创造力的 AI，并正在招聘音乐创作者、音乐爱好者和技术专家。
Yann LeCun 谈 LLMs 与下一代 AI：@ylecun 建议对构建下一代 AI 系统感兴趣的学生不要研究 LLMs，暗示他本人正在研究替代方案。
Mistral AI 发布新的 Base 和 Instruct 模型：@_philschmid 分享了 Mistral AI 发布了新的 7B Base 和 Instruct 模型，具有扩展的 32k 词汇量、function calling 支持以及 Apache 2.0 许可证。
Cerebras 和 Neural Magic 实现稀疏 LLMs：@slashML 分享了来自 Cerebras 和 Neural Magic 的论文，关于实现稀疏的基础 LLMs，以实现更快、更高效的预训练和推理。

AI Reddit 回顾

涵盖 r/LocalLlama, r/machinelearning, r/openai, r/stablediffusion, r/ArtificialInteligence, /r/LLMDevs, /r/Singularity。评论抓取功能现已上线，但仍有很大改进空间！

AI 模型发布与基准测试

微软在 MIT 许可证下发布 Phi-3 模型：在 /r/LocalLLaMA 中，微软已在 Huggingface 上以 MIT 许可证发布了 Phi-3 small (7B) 和 medium (14B) 模型，包括 128k 和 4-8k 上下文版本以及一个视觉模型。
Phi-3 模型已集成到 llama.cpp 和 Ollama：Phi-3 模型已被添加到 llama.cpp 和 Ollama 框架中，基准测试显示它们在 7-14B 参数范围内的表现优于其他模型。
Meta 可能不会开源 400B 模型：根据 /r/LocalLLaMA 上的一位爆料者，Meta 可能会违背之前的迹象，不开源其 400B 模型，这会让许多人感到失望。
基准测试比较了 17 个 LLM 在 NL to SQL 上的表现：/r/LocalLLaMA 上发布的一项全面基准测试比较了包括 GPT-4 在内的 17 个 LLM 在自然语言转 SQL (NL to SQL) 任务上的表现，GPT-4 在准确性和成本方面领先，但不同托管平台的性能差异显著。

AI 硬件与计算

微软为主流 PC 引入 NPU：微软宣布神经网络处理单元 (NPU) 将成为主流 PC 处理 AI 工作负载的标配，新款 Surface 笔记本电脑将提供 独有的 64GB RAM 选项以支持大模型。
M.2 和 PCIe NPU 加速器概览：/r/LocalLLaMA 上的一篇综述探讨了目前 M.2 和 PCIe NPU 加速卡的情况，指出大多数加速卡在内存带宽方面仍落后于 GPU，但该领域正在迅速发展。

AI 担忧与监管

欧洲通过《AI 法案》监管 AI 开发和使用：欧盟已通过全面的《AI 法案》(AI Act)，该法案将 从 2026 年开始监管 AI 系统的开发和使用，并可能影响全球的监管趋势。
加州参议院通过 AI 安全与创新法案：加州参议院通过了 SB1047 法案以促进 AI 安全与创新，反应褒贬不一，一些人担心这会限制该州的 AI 进步。
TED 负责人称 Meta 开源 AI 是“鲁莽的”：TED 负责人 Chris Anderson 称 Meta 开源 AI 模型是“鲁莽的”，对于 AI 进步的倡导者来说，这样一位有影响力的人物持此立场令人担忧。

AI 助手与 Agent

微软推出 Copilot AI Agent 功能：微软宣布了 Copilot 的新 Agent 功能，它们可以 充当虚拟员工，早期预览展示了其自动化复杂工作流的能力。
演示展示了实时多模态 AI 游戏 Agent：/r/singularity 上发布的一个演示展示了 实时多模态 AI Agent 如何通过视觉感知游戏状态并提供战略指导来辅助视频游戏。
关于亚马逊 AI 助手缺乏进展的疑问：/r/singularity 讨论了亚马逊在 AI 助手方面相对于其他科技巨头明显的进展不足，考虑到他们通过 Alexa 拥有的广泛消费者覆盖面，这一点令人费解。

Meme 与幽默

Meme 凸显 AI 的飞速进展：关于 AI 进步的飞快速度、各大公司夸张的宣称以及对先进 AI 系统的担忧，各种 Meme 和笑话广为流传。

AI Discord 摘要回顾

摘要之摘要的摘要

LLM 基准测试与性能优化：
- 微软的 Phi-3 Models 提供了高上下文长度和强劲性能，引发了关于基准测试和内存使用的讨论，但也发现了在 llama.cpp 等工具中的兼容性问题。
- 讨论了如 torch.compile 和特定 GPU 设置等各种优化计算效率的技术，并通过 tensor 重塑示例等见解进行了分享。
开源 AI 工具与框架：
- Axolotl 框架成为微调 Llama 和 Mistral 等模型的首选，其 Docker 设置简化了使用（快速入门指南）。
- LlamaIndex 引入了文档解析和批处理推理技术，集成了 GPT-4o 的能力，以增强复杂文档处理和查询准确性。
AI 立法与社区响应：
- 加利福尼亚州的 SB 1047 法案引发了关于新规对开源模型影响的激烈辩论，人们担心这会扼杀创新并偏袒主要的既得利益者。
- 围绕 AI 语音复制产生了伦理和法律问题的讨论，特别是 OpenAI 争议性地模仿 Scarlett Johansson 的声音，在公众强烈反对后随后将其移除。
新型 AI 模型发布与分析：
- 社区对 Mistral-7B v0.3（具有扩展词汇表和 function calling，详情）等新发布感到兴奋，而 Moondream2 的更新提高了视觉问答的分辨率和准确性。
- Anthropic 在 可解释机器学习（interpretable machine learning） 方面的工作以及 Phi-3 Vision 的发布，促使人们深入研究扩展单语义性（研究）和实际的 AI 应用。
实际 AI 实现与挑战：
- 成员们分享了实际的 AI 实现，从使用 Surya OCR 进行 PDF 提取并将文档转换为 markdown（GitHub 仓库），到在 Azure 上构建安全的代码执行环境（动态会话）。
- LangChain 社区强调了部署和端点一致性问题，GitHub 仓库上的详细故障排除帮助简化了部署流程并增强了 chatbot 功能。

完整的频道细分内容已在邮件中截断。

如果您想查看完整细分，请访问此邮件的网页版：！

如果您喜欢 AInews，请分享给朋友！预先感谢！

**AI 工程全集，尽在此处** （也可以翻译为：**AI 工程一站式汇总**）

AI Engineer World’s Fair (6 月 25-27 日在旧金山)

AI Twitter 综述

AI Reddit 回顾

AI Discord 摘要回顾

AI 工程全集，尽在此处（也可以翻译为：AI 工程一站式汇总）