ainews-the-top-ai-engineer

**AI 工程全集,尽在此处** (也可以翻译为:**AI 工程一站式汇总**)

即将于 6 月 25 日至 27 日在旧金山举行的 AI 工程师世界博览会 (AI Engineer World’s Fair) 将采用显著扩大的活动形式,届时将有来自 OpenAI、DeepMind、Anthropic、Mistral、Cohere、HuggingFaceCharacter.ai顶尖模型实验室的展位、演讲和研讨会。此外,微软 Azure、亚马逊 AWS、谷歌 Vertex 以及 英伟达 (Nvidia)、Salesforce、万事达卡 (Mastercard)、派拓网络 (Palo Alto Networks) 等各大公司也将参与其中。

本次活动涵盖 9 个主题方向,包括 RAG(检索增强生成)、多模态、评估/运维 (evals/ops)、开源模型、代码生成、GPU、智能体 (agents)、财富 500 强中的 AI,以及新增的 AI 领导力方向。

此外,Anthropic 分享了关于 Claude 3 Sonnet 的可解释性研究,揭示了数百万个可引导的可解释特征,这些特征可用于修改模型行为,包括与偏见和不安全内容相关的安全特征,不过其实际应用仍需进一步研究。该活动还为 AI News 的读者提供了折扣码。

#interpretability #feature-steering #safety #multilinguality #multimodality #rag #evals-ops #open-models #code-generation #gpus #agents #ai-leadership claude-3-sonnet claude-3 openai google-deepmind anthropic mistral-ai cohere hugging-face adept midjourney character-ai microsoft amazon nvidia salesforce mastercard palo-alto-networks axa novartis discord twilio tinder khan-academy sourcegraph mongodb neo4j hasura modular cognition anysphere perplexity-ai groq mozilla nous-research galileo unsloth langchain llamaindex instructor weights-biases lambda-labs neptune datastax crusoe covalent qdrant baseten e2b octo-ai gradient-ai lancedb log10 deepgram outlines crew-ai factory-ai

Deep IRL networks 是你唯一需要的!6 月 25-27 日在旧金山。

2024/5/21-2024/5/22 AI 新闻。 我们为您检查了 7 个 subreddits、384 个 Twitter 账号29 个 Discord(380 个频道和 7699 条消息)。 预计节省阅读时间(以 200wpm 计算):805 分钟

有很多非技术性新闻——加州参议院通过了 SB 1047,关于 Vox 报道的 OpenAI 员工合同安全派辞职 的更多爆炸性新闻,虽然 Mistral v0.3 已发布,但目前还没有评估报告或博客文章可供讨论。

鉴于今天是技术上的平静日,我们借此机会分享 AI Engineer World’s Fair 首批演讲者名单 的公告!

摘要:我们为 AI News 读者提供一次性折扣:点击此处 并在周五结束前输入 AINEWS :)

image.png

AI Engineer World’s Fair (6 月 25-27 日在旧金山)

首届峰会好评如潮,现在的新形式规模扩大了 4 倍,包含展位、演讲和研讨会,参与方包括:

  • 顶级模型实验室 (OpenAI, DeepMind, Anthropic, Mistral, Cohere, HuggingFace, Adept, Midjourney, Character.ai 等)
  • 三大云厂商 (Microsoft Azure, Amazon AWS, Google Vertex)
  • 将 AI 投入生产的大型公司 (Nvidia, Salesforce, Mastercard, Palo Alto Networks, AXA, Novartis, Discord, Twilio, Tinder, Khan Academy, Sourcegraph, MongoDB, Neo4j, Hasura 等)
  • 设定议程的颠覆性初创公司 (Modular 即 Chris Lattner, Cognition 即 Devin, Anysphere 即 Cursor, Perplexity, Groq, Mozilla, Nous Research, Galileo, Unsloth 等)
  • AI Engineer 领域的顶级工具 (LangChain, LlamaIndex, Instructor, Weights & Biases, Lambda Labs, Neptune, Datastax, Crusoe, Covalent, Qdrant, Baseten, E2B, Octo AI, Gradient AI, LanceDB, Log10, Deepgram, Outlines, Unsloth, Crew AI, Factory AI 等等)

涵盖 9 个演讲方向RAG、Multimodality、Evals/Ops(新增!)、Open Models(新增!)、CodeGen、GPUs(新增!)、Agents、AI in the Fortune 500(新增!),以及首次设立的专门面向 AI 副总裁的 AI Leadership 方向,还有 50 多场研讨会和展览会议,涵盖了所有 AI 工程主题。当然,最重要的方向是未列出的:走廊交流 (hallway track),我们对此投入了大量心血,但在发生之前无法描述。

为了庆祝 World’s Fair 的启动,我们为 AI News 读者提供一次性折扣点击此处 并在周五结束前输入 AINEWS :)

如果这里或 Latent Space 的内容与你的兴趣具有最高的余弦相似度 (cosine similarity),那么这个会议就是为你量身定制的。6 月 25-27 日旧金山见!


目录和 Discord 摘要已移至此邮件的网页版:


AI Twitter 综述

所有综述均由 Claude 3 Opus 完成,从 4 次运行中选取最佳。我们正在尝试使用 Haiku 进行聚类和流程工程 (flow engineering)。

Anthropic 关于 Claude 3 Sonnet 的可解释性研究

  • 提取可解释特征@AnthropicAI 使用字典学习从 Claude 3 Sonnet 的激活值中提取了数百万个可解释的“特征”,这些特征对应于模型学到的抽象概念。许多特征是多语言和多模态的
  • 通过特征引导修改行为@AnthropicAI 发现,在前向传播过程中对这些特征进行干预(“特征引导”)可以以与特征含义相关的可解释方式,可靠地修改模型的行为和输出
  • 安全相关特征@AnthropicAI 识别出许多与令人担忧的能力或行为相对应的“安全相关”特征,例如不安全代码、偏见、不诚实、权力寻求以及危险/犯罪内容。激活这些特征可能会诱导模型表现出这些行为。
  • 初步工作,仍需更多研究@AnthropicAI 指出这项工作是初步的,虽然这些特征似乎与安全应用有合理的关联,但仍需要大量工作来建立实际效用
  • 可解释性团队招聘@AnthropicAI 正在为其可解释性团队招聘经理、研究科学家和研究工程师,以进一步推进这项工作。

Microsoft 的 Phi-3 模型

  • Phi-3 小型和中型模型发布@_philschmid 宣布 Microsoft 已在 MIT 许可证下发布了 Phi-3 small (7B) 和 medium (14B) 模型,其 instruct 版本支持高达 128k 的上下文
  • 表现超越 Mistral, Llama, GPT-3.5@_philschmid 声称 Phi-3 small 在基准测试中优于 Mistral 7B 和 Llama 3 8B,而 Phi-3 medium 的表现则优于 GPT-3.5 和 Cohere Command R+
  • 训练细节@_philschmid 指出这些模型是在 4.8 万亿个 token 上训练的,包括合成数据和过滤后的公开数据集,并支持多语言,通过 SFT 和 DPO 进行了微调。目前尚未发布基座模型。
  • Phi-3-Vision 模型:Microsoft 还发布了拥有 4.2B 参数的 Phi-3-vision,@rohanpaul_ai 指出它在视觉推理任务上优于 Claude-3 Haiku 和 Gemini 1.0 Pro V 等更大规模的模型
  • 基准测试与微调:许多人渴望对 Phi-3 模型进行基准测试,并可能针对特定应用进行微调,尽管 @abacaj 指出在对话模型上进行微调有时会导致性能比基座模型更差

Perplexity AI 与 TakoViz 合作开展知识搜索

  • 使用 TakoViz 进行先进知识搜索@perplexity_ai 宣布与 TakoViz 建立合作伙伴关系,为 Perplexity 用户带来先进的知识搜索和可视化功能,允许他们搜索、对比并分享权威的知识卡片。
  • 权威数据提供商@perplexity_ai 指出 TakoViz 的知识来源于权威数据提供商,其不断增长的索引涵盖了金融、经济和地缘政治数据
  • 交互式知识卡片@AravSrinivas 解释说,用户现在可以提示 Perplexity 比较特定时间段内的股票价格或贷款等数据,并返回交互式知识卡片。
  • 超越摘要功能@AravSrinivas 表示,这使得 Perplexity 能够超越简单的摘要,实现跨时间线的细粒度数据查询,现在通过单个搜索栏即可完成。
  • 对合作的热情@AravSrinivas 表达了他对与 TakoViz 团队合作并参与其种子前轮融资的热爱,并提到了他们的客户至上精神以及这次集成将为 Perplexity 用户带来的价值

杂项

  • Karina Nguyen 加入 OpenAI@karinanguyen_ 宣布在 Anthropic 工作 2 年后离职并加入 OpenAI 担任研究员,分享了关于 AI 进展、文化和个人成长的经验教训
  • Suno 为 AI 音乐融资 1.25 亿美元@suno_ai_ 宣布融资 1.25 亿美元,旨在构建能够增强音乐制作中人类创造力的 AI,并正在招聘音乐创作者、音乐爱好者和技术专家。
  • Yann LeCun 谈 LLMs 与下一代 AI@ylecun 建议对构建下一代 AI 系统感兴趣的学生不要研究 LLMs,暗示他本人正在研究替代方案。
  • Mistral AI 发布新的 Base 和 Instruct 模型@_philschmid 分享了 Mistral AI 发布了新的 7B Base 和 Instruct 模型,具有扩展的 32k 词汇量、function calling 支持以及 Apache 2.0 许可证
  • Cerebras 和 Neural Magic 实现稀疏 LLMs@slashML 分享了来自 Cerebras 和 Neural Magic 的论文,关于实现稀疏的基础 LLMs,以实现更快、更高效的预训练和推理

AI Reddit 回顾

涵盖 r/LocalLlama, r/machinelearning, r/openai, r/stablediffusion, r/ArtificialInteligence, /r/LLMDevs, /r/Singularity。评论抓取功能现已上线,但仍有很大改进空间!

AI 模型发布与基准测试

  • 微软在 MIT 许可证下发布 Phi-3 模型:在 /r/LocalLLaMA 中,微软已在 Huggingface 上以 MIT 许可证发布了 Phi-3 small (7B) 和 medium (14B) 模型,包括 128k 和 4-8k 上下文版本以及一个视觉模型
  • Phi-3 模型已集成到 llama.cpp 和 Ollama:Phi-3 模型已被 添加到 llama.cppOllama 框架中,基准测试显示它们在 7-14B 参数范围内的表现优于其他模型
  • Meta 可能不会开源 400B 模型:根据 /r/LocalLLaMA 上的一位爆料者,Meta 可能会违背之前的迹象,不开源其 400B 模型,这会让许多人感到失望
  • 基准测试比较了 17 个 LLM 在 NL to SQL 上的表现/r/LocalLLaMA 上发布的一项全面基准测试 比较了包括 GPT-4 在内的 17 个 LLM 在自然语言转 SQL (NL to SQL) 任务上的表现,GPT-4 在准确性和成本方面领先,但不同托管平台的性能差异显著

AI 硬件与计算

AI 担忧与监管

AI 助手与 Agent

Meme 与幽默

  • Meme 凸显 AI 的飞速进展:关于 AI 进步的飞快速度各大公司夸张的宣称以及对先进 AI 系统的担忧,各种 Meme 和笑话广为流传

AI Discord 摘要回顾

摘要之摘要的摘要

  1. LLM 基准测试与性能优化
    • 微软的 Phi-3 Models 提供了高上下文长度和强劲性能,引发了关于基准测试和内存使用的讨论,但也发现了在 llama.cpp 等工具中的兼容性问题。
    • 讨论了如 torch.compile 和特定 GPU 设置等各种优化计算效率的技术,并通过 tensor 重塑示例等见解进行了分享。
  2. 开源 AI 工具与框架
    • Axolotl 框架成为微调 Llama 和 Mistral 等模型的首选,其 Docker 设置简化了使用(快速入门指南)。
    • LlamaIndex 引入了文档解析和批处理推理技术,集成了 GPT-4o 的能力,以增强复杂文档处理和查询准确性。
  3. AI 立法与社区响应
    • 加利福尼亚州的 SB 1047 法案引发了关于新规对开源模型影响的激烈辩论,人们担心这会扼杀创新并偏袒主要的既得利益者。
    • 围绕 AI 语音复制产生了伦理和法律问题的讨论,特别是 OpenAI 争议性地模仿 Scarlett Johansson 的声音,在公众强烈反对后随后将其移除。
  4. 新型 AI 模型发布与分析
    • 社区对 Mistral-7B v0.3(具有扩展词汇表和 function calling,详情)等新发布感到兴奋,而 Moondream2 的更新提高了视觉问答的分辨率和准确性。
    • Anthropic 在 可解释机器学习(interpretable machine learning) 方面的工作以及 Phi-3 Vision 的发布,促使人们深入研究扩展单语义性(研究)和实际的 AI 应用。
  5. 实际 AI 实现与挑战
    • 成员们分享了实际的 AI 实现,从使用 Surya OCR 进行 PDF 提取并将文档转换为 markdown(GitHub 仓库),到在 Azure 上构建安全的代码执行环境动态会话)。
    • LangChain 社区强调了部署和端点一致性问题,GitHub 仓库上的详细故障排除帮助简化了部署流程并增强了 chatbot 功能。

完整的频道细分内容已在邮件中截断。

如果您想查看完整细分,请访问此邮件的网页版:

如果您喜欢 AInews,请分享给朋友!预先感谢!