2024年3月20日至3月21日的 AI 新闻。我们为您检查了 358 个 Twitter 账号和 21 个 Discord（337 个频道，9841 条消息）。预计节省阅读时间（以 200wpm 计算）：1033 分钟。

这是一个新闻较少的日子 —— Sakana 发布了一篇进化模型合并 (evolutionary model merging) 论文，OpenInterpreter 推出了他们的 O1 devkit，人们正在讨论如果你制作 10-shot 示例，Claude Haiku 是如何被低估的。

但借着今天 Reddit 成功 IPO 的机会，是时候终于为 AINews 引入 Reddit 摘要了！目前先从 /r/LocalLlama 开始，我们很快会开始总结评论，接下来我们规划了 r/machinelearning, r/openai, r/stablediffusion, r/ArtificialInteligence。如果您发现我们遗漏了任何重大的 alpha 信息发布版块，请告诉我们。

[TOC]

REDDIT: /r/LocalLlama

模型发布与基准测试

Cerebrum 8x7b 来了！ Aether Research 发布了基于 Mixtral 的 Cerebrum 8x7b，其训练方式与其 7b 版本类似。它在推理任务上的表现与 GPT 3.5 Turbo 和 Gemini Pro 相当，使其成为开源推理模型的 SOTA。(201 upvotes)
Moistral 11B v1，最“湿润”的 Mistral —— 来自 Cream-Phi-2 的创作者！（微调，非合并） (165 upvotes)
使用 Claude3 作为评委的新创意写作基准测试创建了一个使用 Claude Opus 作为评委的创意写作基准测试，包含 19 个写作提示、36 个狭义定义的评估标准，以及每个问题的示例参考输出。(14 upvotes)

量化与性能优化

[求助/严肃讨论] - 我尝试实现 1.58 BitNet —— 但我卡住了。一位业余爱好者尝试实现 1.58 BitNet Ternary 论文，生成的模型符合预期大小（例如 300M 参数为 72MB）。然而，他们遇到了训练损失 (training loss) 不下降以及推理 (inference) 无法正常工作的问题。(32 upvotes)
1 bit LLM 时代 —— 训练、技巧、代码分享了 1.58bit 论文的后续。(110 upvotes)
Nvidia Blackwell (h200) 与 FP4 精度新的 Nvidia h200 芯片支持 FP4，但目前尚不清楚这种级别的量化在实践中对 LLM 是否有用，因为即使是 FP8 也很少被使用。(8 upvotes)

部署与服务

LMDeploy 非常易于使用，且在 VLM 部署方面效率极高。[讨论] LMDeploy v0.2.6+ 支持多模态模型 (VLM) 的推理和服务，只需使用 pipeline API 编写几行代码即可。像 Qwen-VL-Chat 这样的模型可以使用兼容 OpenAI 的服务器或 Gradio UI 进行服务。(18 upvotes)
寻找支持 LLM API（openrouter, openai 等）、插件和 RAG 支持的 GUI。一位用户正在寻找一个用户友好的 GUI，支持 OpenAI 的 ChatGPT API（或 OpenRouter 等兼容接口），并允许使用插件和 RAG。(3 upvotes)
带有 RAG 的 LocalLLM 多用户服务器有人尝试将 gpt4all 设置为带有 sbert 插件的内部服务器以处理本地文件，但在通过 API 使其工作时遇到了困难。(2 upvotes)

训练数据与微调

生成训练数据的流水线（10,000 名不同人士的 10,000 篇日记条目）构建了一个用于生成多样化合成日记数据以进行微调的流水线。它使用了 Prompt 变体、生活变量（职业、情绪等）和随机选择来避免重复内容。(4 upvotes)
为聊天微调语言模型有人询问如何仅使用文章针对新主题微调聊天语言模型，以及是否需要 Q&A 数据集。(0 upvotes)
准备训练数据一位用户询问如何为微调准备训练数据。(2 upvotes)

硬件与计算资源

升级 PC/GPU 以在本地运行 LLM 有人正考虑升级 GPU 以在本地运行不错的 LLM，目前在考虑 24GB VRAM 的 NVIDIA 显卡。他们想知道主板等其他组件是否也需要升级。(3 upvotes)
在 RTX 4080 笔记本电脑上进行微调一位用户想知道在配备 RTX 4080 12GB 的笔记本电脑上对 Mistral 7B 等模型进行微调是否可行。(2 upvotes)
从性价比来看，旧矿卡 P102-100 值得吗？有人询问单价 20 美元的旧 P102-100 矿卡在推理方面的性价比是否值得，考虑到它们可以解锁到 10GB 但只有 PCIE 1.1 x4 通道。(1 upvote)

梗图与幽默

“下一个是谁？” 一张梗图，调侃微软为了垄断市场而破坏开源 AI 计划。(349 upvotes)
我用 LLM 做了一个游戏。它叫 Classroom Simulator，灵感来自《模拟人生》和《黑与白》。目前已上线并免费游玩。链接在评论区。 (101 upvotes)
我讨厌微软一位用户发泄对微软的不满，指责其为了垄断 AI 市场而“破坏每一个开源计划”。(92 upvotes)

第 X 部分：AI Twitter 回顾

所有回顾均由 Claude 3 Opus 完成，取 4 次运行中的最佳结果

英特尔与 AI 产能

@sama: “很高兴看到这一点——为英特尔、美国以及更多的 AI 产能感到兴奋！” (681k views)

调试与反直觉的代码

@francoisfleuret: “2 小时的调试。不管你怎么说，这都很反直觉。” (541k views)
@francoisfleuret: “话虽如此，我不认为不同的语言设计能解决这种‘反直觉’的特定问题。” (13k views)
@francoisfleuret: “当你那个让你从床上跳起来的想法行不通时的那种感觉（TFW）。” (4k views)

微软与 OpenAI

@AISafetyMemes: “微软 CEO：如果 OpenAI 明天消失了也没关系” (192k views)
@Teknium1: “微软的愚蠢举动。微软雇佣了一个末日论骗子、大师级书籍推销员来‘领导’他们新的 AI 计划。这家伙几个月前才创办了 Inflection，筹集了 20 亿美元来资助他的新书巡回宣传，然后就跑路了？笑死。好吧，我想这让微软彻底退出了优秀模型的竞争。” (180k views)
@Teknium1: “我想当你是一个末日论者时，最好的做法就是锁死本可以流向别处的 20 亿美元 VC 资金，然后锁死 50,000 块 H100，接着离开，最后锁死微软自己的 AI 努力 😏” (16k views)
@mark_riedl: “这是我对微软和 Inflection AI 新闻的看法：纳德拉雇佣了一位虐待员工、拖延性虐待案件的毒性经理来管理他们新的 AI 部门。但我猜雇佣 DeepMind 的创始人比拥有良好的领导力更重要。” (15k views)
@ethanCaballero: ““现在我成了微软，前沿模型初创公司的吞噬者”” (2k views)

用于对话生成的 Q-Star 基于能量的模型

@jeremyphoward: 为普通本科生编写的关于对话生成的 Q-star 基于能量的模型 (EBM) 理念的详细解释。关键点：使用抽象语义表示空间，通过优化寻找能量最低的响应，将“决定说什么”与“如何说”分离。(186k views)
@jeremyphoward: “引用推文和回复中的很多人都没看该线程的第 2 条帖子……（提示——那才是真正重要的部分。）”(16k views)
@jeremyphoward: “但实际上这根本不是对 Q* 的描述。相反，它是 Claude 自动生成的关于 @ylecun 的 EBM 项目的解释。如你所见，它们确实看起来非常相似。我对这些关于 OpenAI ‘泄密’的说法持怀疑态度。它似乎只是在总结 Yann 的工作。”(13k views)
@leithnyang: “这基本上就是把 Yann LeCun 的 JEPA 架构重新包装成了 Q*”(113 views)

建议与观察

@gdb: “知道该做什么和实际去做都至关重要，但只看重其中之一是常见的错误”(142k views)
@gdb: “对细节的执着被低估了”(113k views)
@AravSrinivas: “极少数人理解长期主义思维。而那些理解的人将获得巨大的回报。”(57k views)

梗与幽默

@KevinAFischer: “没什么好看的。只是一个随机鹦鹉 (stochastic parrot)”(23k views)
@cto_junior: “获得新老婆 (waifu)”(30k views)
@Nexuist: “科技男 (techbros) 卖出 1,000,000 辆电动汽车，他们对世界来说仍然是坏人；科技男将 100,000 吨物资送入轨道，他们对世界来说仍然是坏人；科技男治愈了 10,000 名四肢瘫痪者，他们对世界来说仍然是坏人 <— 你现在就在这里”(72k views)
@cto_junior: “你有什么毛病”(3k views)
@nearcyan: “想象一下，作为一个没有 Neuralink 的创始人，你必须像个老头一样动动手才能工作，哈哈”(17k views)
@nearcyan: “哇，你们真的很奇怪”(3k views)
@cto_junior: “想象一下这在 Neuralink 上运行 🤩🤩🤩 你可以一直待在 gooncave 里，不管外面是 Hacker Way 1 号还是达美乐披萨店”(1k views)

PART 0: 摘要之摘要之摘要

我们得出结论，Claude Opus 是顶级摘要的最佳模型，因此我们将停止 A/B/C 测试（有关我们的努力/记录，请参阅存档）。我们将为所有 3 个及更多模型（包括 Gemini 1.5!!）提供并行运行，因为这个问题在拓扑上与我们将要推出的个性化应用相似。

1. Grok-1：巨兽出笼

xAI 发布了 Grok-1，这是一个 3140 亿参数的 Mixture-of-Experts 模型，引发了关于其性能与 GPT-3.5、Mixtral 和 LLaMA 对比的辩论。该模型可在 GitHub 上通过 Apache 2.0 许可证获取。
讨论集中在 Grok-1 持续预训练 (continual pretraining) 的潜力、量化策略 (quantization strategies)，以及通过 种子 (torrents) 分发对开源 AI 可信度的影响。
一个高中期末考试数据集显示，尽管对其质量存在质疑，但 Grok-1 的表现与 GPT-4 和 Claude 接近。

2. 检索增强生成 (RAG) 的创新

成员们探索了增强 RAG 模型的功能，例如用于详细/结构化输出的 响应模式、引用高亮、意图理解以及为了提高相关性的任务分解。
提议包括 平衡外部上下文利用与内部知识、训练用于高效实时 RAG 操作的专用模型，以及 输出格式化 的最佳实践。
共享了相关资源，包括 Command R 用于 RAG 的 GitHub 实现以及带有行内引用的 Cohere 模型。

3. 大语言模型 (LLM) 的扩展策略与效率

讨论围绕扩展上下文长度的 持续预训练方案 展开，重点关注这篇论文中强调的数据工程方法。
一篇 arXiv 论文提出了具有成本效益的技术，如 学习率预热 (learning rate warming) 和数据重放 (data replay)，用于在不进行完整重新训练的情况下更新 LLM。
探索了像 Smallstral 这样 缩减模型 (downscaling models) 的可行性，在性能和高效预训练方面展现了前景。

4. 语言模型的多语言挑战与基准测试

讨论涉及在处理基于英语主导语料库训练的多语言模型时，特定语言知识的复杂性，并引用了这篇论文。
成员们强调需要 针对德语的基准测试 来衡量母语质量，提议进行大学合作，并参考了 SuperGLEBer 等资源。
关于高效 LLM 推理的 Medusa 论文以及一项关于 LLM 对同行评审影响的研究，引发了围绕模型效率和学术影响的对话。

5. 其他

LangChain 增强与集成：LangChain 用户正在探索 astream_events 等新功能，为高级研究助手 Rubik’s AI 寻找 Beta 测试人员，并分享 AI 聊天机器人和书签管理器等项目。此外还在讨论与 Vertex AI 和 Hugging Face 的集成，以及关于构建 AI 应用和 plan-and-execute agents 的教程。
光子学与 NVIDIA 的进展：围绕比传统芯片快 1000 倍的新型光子芯片以及 NVIDIA 的 H100 GPU 搭配功耗约 850W 的 ARM 架构 CPU 的讨论引发了热议。NVIDIA 的 GTC Keynote 也因提到 1.8T 参数模型和带有 192GB HBM 的 B100 等新硬件而令人振奋。
提示工程 (Prompt Engineering) 与测试工具：新的提示工程和测试工具及平台不断涌现，例如 Prodigy 的提示工程功能、PromptTools、PromptFoo、Vercel 的 AI Playground 以及 Helicone.ai。此外还进行了 AI 增强博客定制的实验，并讨论了 AI 辅助博客功能。

PART 1: 高层级 Discord 摘要

Stability.ai (Stable Diffusion) Discord

推出下一代 Stable Video 3D：Stability.ai 发布了 Stable Video 3D (SV3D)，该模型取代了 Stable Video Diffusion，能够从单张图像生成增强的 3D 和多视角合成。他们推出了两个新变体：用于生成轨道视频的 SV3D_u 和具有高级功能的 SV3D_p。在此了解更多关于 SV3D 的信息。
Cascade 的代码难题：在与 Stable Diffusion 社区的交流中，一位工程师感叹运行 Stable Cascade 的代码优化问题，提到它比 Stable Diffusion XL (SDXL) 慢得多，且更消耗 CPU。
焦急等待 Stable Diffusion 3：工程社区对 Stable Diffusion 3 (SD3) 的发布充满期待，表达了对增强 Prompt 遵循能力的希望，并传闻早期访问邀请即将发放。
围绕加密货币合作的安全质疑：有关 Stability AI 进军区块链合作伙伴关系的传闻引起了许多工程师的担忧，引发了关于此举对开源传统和安全标准影响的辩论。
消费级技术运行 AI 的挑战：实际讨论指出了在标准硬件配置上运行 Cascade 或 SD3 等高级 AI 模型所面临的挑战，特别强调了对 GPU VRAM 的需求。工程师们还强调了在包括游戏在内的各种应用中，需要更易于获取的生成式 AI 工具。

Perplexity AI Discord

Pro 会员福利还是困惑的问题？：Perplexity AI 已向 Pro 用户开放 Claude 3 Opus 的无限次每日查询，但用户对考虑到上下文限制（context limits）后“无限”的实际程度表示担忧。关于“无限”在日常使用和上下文方面的具体含义，是社区中的热门话题。

AI 育儿前景：社区展开了一场关于 AI 在简化儿童复杂概念方面作用的激烈讨论，强调了 AI 发展适宜性及其在教育支持中潜力的重要性。

工程师们的困惑：尽管计划弃用 sonar-medium-online 模型，但该模型在截止日期后似乎仍在运行，导致用户困惑。工程师们辩论了 API 的行为，讨论围绕 maxtokens 参数展开，并观察到通过浏览器与通过 API 查询时呈现的不同新闻结果。

寻找真相与技术工作：用户分享了使用 Perplexity AI 的 Claude 3 Opus 进行创意写作实验、查询最简洁选项、探究朝鲜政治动态、推测火星生活以及抓取职位发布的经验。关于搜索结果中提供链接的可变性和可靠性，存在诸多疑问。

对企业合作持谨慎乐观态度：关于 苹果和谷歌潜在 AI 集成 的猜测不断增加，成员们热烈讨论了生成式 AI 合作的细节，并分享了对科技巨头战略和 AI 商业化未来的看法。

Unsloth AI (Daniel Han) Discord

Grok 1 加入对话：Elon Musk 的 Grok 1（一个拥有 3140 亿参数的 Mixture-of-Experts 模型）发布，其巨大的体量令人惊讶，预计性能低于 Miqu 但高于 Llama2 70b。社区对 Grok 1 与 Mixtral 的可比性表现出浓厚兴趣，相关细节通过 Hugging Face 上的 xai-org 等链接分享。
AI 微调技巧与建议：对于在 Mistral-7b 上微调 QLoRA，2e-4 的学习率（最高 3 个 epochs）是首选方案。社区提出了创新的模型合并策略，例如将 UltraChat 和基础 Mistral 的合并策略应用于 Mistral-Yarn，这在社区中引发了怀疑与乐观并存的讨论。
Unsloth AI 登上 GitHub 趋势榜：Unsloth AI 的 GitHub 仓库因其趋势表现备受关注，所有者向用户表示感谢，并邀请更多工程师查看他们的更快的微调仓库 (faster finetuning repository)。
警惕身份冒充：据报道，Discord 上出现了一个冒充 Daniel Han 的诈骗账号。社区受邀保持警惕，强调了核实身份和举报可疑账号的重要性。
模型保存时的 VRAM 困扰：据指出，在保存类似 7b Mistral bnb 4bit 的模型时，需要充足的 VRAM 和额外的系统 RAM 以防止崩溃。这一问题在对比使用 Colab 与本地环境时尤为突出。
社区在 AI 与艺术中的创意联结：社区讨论倾向于创意表达，成员们互相支持诗歌创作。此外，还交流了资源，如强化学习 (Reinforcement Learning) 的可视化工具，以及在 UIverse Elements 上发现的 CSS 或 Tailwind UI 元素集合。

LM Studio Discord

Grok-1 和 Command-R 引发热议：工程师们正在讨论 xAI 的大规模 Grok-1 模型，以及 Command-R 模型通过 llama.cpp Pull Request #6033 与 LM Studio 的待定集成。虽然由于硬件限制，一些人选择了更小、更高效的模型（如 Gemma 2B 或 Mistral 7B），但其他人正在探索 Command-R 的兼容性，并提供了其 Hugging Face 仓库的链接。
LM Studio 功能查询：成员们正在寻求关于 LM Studio 功能的澄清，例如使用个人文档进行对话以及对 autogen 等插件的支持。配置文件可以在 GitHub 上找到，关于 AI 难题的疑问则引导成员在特定频道寻求指导。
寻求 AI 硬件的和谐配置：技术讨论集中在硬件配置上，包括即将推出的 5090 GPU 预期的性价比，以及使用 PCIe risers 进行多 GPU 设置的挑战。一场尤为激烈的辩论围绕着语言模型任务的最佳 GPU 选择，以及自定义设置中散热和功耗的影响展开。
AVX Beta 版与模型支持：LM Studio 的 Beta 版应用是一个旧版本，没有高优先级的 AVX 支持。虽然它支持某些模型，但最新的模型（如 starcoder2 和 gemma）尚不可用。不过，在 Beta 版应用上运行 Mistral 模型是可行的。
AMD ROCm 在 LM Studio 中的角色：适用于 AMD GPU 的 ROCm 库对于 LM Studio 的兼容性至关重要。支持 gfx1031 和 gfx1032 的预构建 Windows ROCm 库已在 GitHub 上分享，但目前的讨论表明，模型目前可能仅利用主 GPU，并对未来支持双 7000 系列 GPU 进行了推测。
Agent 系统评估进行中：一条单独的消息询问了用于验证创意概念的 Agent 系统的选择过程，突显了成员参与 Agent 评估协作项目的进展。

Nous Research AI Discord

NVIDIA 在 RTX 50 系列上采取稳健策略：NVIDIA 计划为其 GeForce RTX 50 系列 “Blackwell” 显卡配备 28 Gbps 的 GDDR7 显存。这比目前已有的 32 Gbps 芯片速度慢，考虑到显存带宽和历史趋势，这一战略选择引发了讨论。链接：NVIDIA’s Memory Strategy。
AI 模型通过 MatchboxDAO 准备进入游戏领域：MatchboxDAO 宣布了一个开放游戏数据用于 AI Agent 开发 的项目，该项目由社区资助，旨在促进游戏 AI 的创新。链接：Game On for AI Developers。
修改记忆 - Grok-1 的发布与局限性：xAI 拥有 3140 亿参数的 MoE 模型 Grok-1 因相较于 GPT-3.5 提升有限而面临审查，引发了关于超大模型实用性和持续预训练需求的疑问。
OpenAI 的 GPT-4 笼罩在猜测中：NVIDIA CEO 暗示了一种具有 1.8 万亿参数的新架构，助长了其可能就是 GPT-4 的传闻。这些猜测包括 OpenAI 尚未正式确认的 MoE 配置暗示。
缩小 LLM 规模以增强性能：一种专注于 模型缩小 (downscaling models) 的新方法（如 Smallstral）在任务表现和持续预训练有效性方面展示了可喜的结果。这强调了 AI 模型缩放策略的多样性和效率潜力。链接：Scaling Downward。
RAG 讨论达到新高度：关于 RAG 能力增强的讨论非常热烈，集中在响应模式和高召回相关性等特性上。社区反思了模型输出中外部上下文利用与内部知识之间的平衡，并探索使用 更小的专业化模型 来优化 RAG 流水线。相关链接：Cohere’s in-line citation model，Command R for RAG GitHub implementation。

Eleuther Discord

Grok-1 面临审查：Grok-1 模型已进入竞技场，但其性能和 Twitter 的聊天机器人界面效果受到质疑。工程师们对 Grok 的模型大小表示担忧，怀疑在与 Mixtral 或 MiQ 等竞争对手相比时，更大是否意味着更好。同时，有人呼吁提供易于获取的 RAG 教程，并建议注意此 GitHub issue 中详述的 PyTorch Mac 错误。
Mamba 模型中的投机采样受到挑战：模型领域的讨论对 Mamba 等模型的投机采样 (Speculative Sampling) 表示怀疑。与 Transformer 不同，它们可能无法从投机采样中获得类似的收益，且验证的计算成本仍然是一个障碍。模型与 lm-eval-harness 的集成正在探索中，同时正在剖析默认使用 gpt-2-small 和评估挂起等问题，包括此处发现的特定死锁问题。
数据复杂度动摇缩放定律：在 #scaling-laws 频道中，焦点在于数据集复杂度如何影响语言模型缩放定律 (Scaling Laws)，其中来自概率上下文无关文法 (PCFG) 的句法属性和 gzip 压缩在预测中发挥了作用。研究人员正屏息以待更广泛的实验，以确定缩放定律的具体数值。
N-gram 采样技术辩论：在 #interpretability-general 中，工程师们面临从特定 n-gram 统计数据中采样字符串的挑战。提出了一种自回归采样方法来创建与这些统计数据一致的最大熵分布，并在 GitHub 上分享了一个实际示例。
为预训练打乱 The Pile 数据：关于 The Pile 数据打乱的询问得到了澄清：原始文件没有打乱，但在 Hugging Face 上提供的预分词 (pretokenized) 数据是打乱过的。这是 Pythia 使用的同一数据集，并指出虽然 The Pile 的单个组件未打乱，但训练/测试/验证集预计是混合的。

OpenAI Discord

思考 AI 的本质与技术：工程师们讨论了像 ChatGPT 这样的 AI 是否真正“理解”语言，还是由复杂的 next-word prediction（下一个词预测）算法创造的错觉。人类训练的影响也受到了辩论，一些人认为它赋予了超越部分人类的对话能力。
惊叹于 DALL-E 3 的能力：社区对 DALL-E 3 相比前代在遵循详细 Prompt 方面的先进能力表示赞赏，同时也考虑了速度和图像保存等实际方面。还提到了利用 DALL-E 3 和 GPT-4 的 ChatGPT+ 的优势。
AI 模型对比：根据用户体验对 GPT-4 和 Claude 进行了对比，讨论了它们的对话能力、成本效率，以及在冗长度和政治正确性方面的各自优势。
AI 使用中的挑战与优化：用户分享了在创作过程中对敏感内容过滤器的挫败感，注意到 ChatGPT 的行为变化（可能由于浏览器扩展冲突引起），并寻求防止 AI 模型拒绝回答的方法。
学习 AI 平台与 Prompt 创作：交流了学习 AI 概念的资源，特别是关于 PyTorch 以及深入研究 AI 所需的数学基础。探索了用于分类任务的 Prompt 以旨在提高性能，同时分享了规避拒绝回答的 Prompt 策略。

HuggingFace Discord

为 Aya 添加滑块：Aya 演示已集成 repetition penalty（重复惩罚），并寻求贡献者在 Gradio 界面中添加 slider feature（滑块功能）。可以通过这里的 PR 进行贡献。
NVIDIA 的强力组合：NVIDIA 的 H100 GPU 与基于 ARM 的服务器 CPU 相结合，功耗约为 850W；而基准测试表明 H100 alone（单独 H100）功耗就可达 700W。详情请参考这些基准测试。
HuggingFace 的数据守护者：HuggingFace 拥有一个 data leaderboard（数据排行榜），重点展示了该平台上托管的超过 120B models。在这里探索广阔的数据。
使用 Hugging Face 和 SageMaker 导航 MLOps：一个 Amazon SageMaker 和 Hugging Face 工作坊提供了一个用于创建 MLOps pipeline 的 notebook；适合希望简化机器学习操作的人员。点击这里查看工作坊。
多语言思考与 AI：讨论涉及了跨 中文和英文 等不同语言工作的机器学习模型，强调了处理特定语言知识和任务时的复杂性。此外，关于 高效语言模型推理的 Medusa 论文，以及一项关于 LLMs 对科学同行评审影响 的研究，引发了关于模型效率和 LLMs 在学术界影响的对话。参考 Medusa 论文这里，以及同行评审影响研究这里。
NL2SQL 的进展与 NVIDIA 的新型芯片组：一位工程师正在完善 NL2SQL pipeline，同时 NVIDIA 的 Grace Hopper Superchip 因其在 AI 相关任务中的出色表现而受到关注。对于 NLP 初学者，推荐了 Hugging Face 的 NLP course 和斯坦福大学的 SLP3 manuscript 等资源，并询问了用于 LLM 部署的免费 API，提到 “ollama” 是一个潜在资源。

LlamaIndex Discord

交互式文档革新 RAG: 提出了一种在 RAG pipeline 中处理复杂查询的新方法，通过将文档视为交互式工具，从而实现更细致的交互和更好的查询解析。
LlamaIndex v0.10.20 发布，引入 Instrumentation: 最新的 LlamaIndex 更新包含一个 Instrumentation 模块，通过关于基础可观测性和 API 调用追踪的 notebook 进行了详细说明。
通过 Search-in-the-Chain 增强问答: Shicheng Xu 等人讨论的一篇论文提供了一种将检索与规划交织在一起以改进问答的新方法，重点在于步骤验证和计划调整，详见此处。
融合 RAG 与求职: Kyosuke Morita 的博客文章深入探讨了一个求职辅助工具，该工具融合了 LlamaParse 和 LlamaIndex，根据候选人的简历量身定制职位匹配。
MemGPT 研讨会扩展 Agent 内存: Charles Packer 主持的研讨会探讨了 MemGPT 架构，该架构赋予 Agent 内存工具以与核心内存交互，从而提升 function-calling 能力。

Latent Space Discord

Yann LeCun 对 LLM 的看空引发辩论: 由 @Teknium1 的推文引发的对话讨论了 Yann LeCun 对大语言模型（LLMs）的怀疑可能源于对不依赖内部独白的认知过程的思考。讨论涉及“形状旋转者（shape rotators）”与“文字工作者（wordcels）”的概念，并引用了对缺乏内心独白的人的采访。
Grok-1 的开源发布伴随着质疑与希望: xAI 发布了 Grok-1，这是一个拥有 3140 亿参数的巨型 Mixture-of-Experts 模型，邀请 AI 社区为其持续训练和评估做出贡献。怀疑者和乐观主义者纷纷发表看法，将 Grok-1 与 LLaMA 和 Claude 等模型进行比较，并思考持续预训练可能带来的改进，正如 Yao Fu 在关于 Grok 潜力的思考中所指出的。
Paper Club Session 亮点 - Attention 的起源: Paper Club session 阐明了 Transformer 中 Attention 机制出现背后的“原因”，展示了其相对于固定长度编码向量的突破，并允许模型引用输入序列的任何部分，从而为 Transformer 的效率铺平了道路。
Lex Fridman 的播客因缺乏深度受到批评: 听众对 Lex Fridman 采访 Sam Altman 的播客表示失望，批评其缺乏对 OpenAI 运营细节和政治环境的深入讨论，认为这是 AI 领域实质性对话的一次错失机会。
关于检索增强生成（RAG）和 Embeddings 的讨论: 在 AI in Action Club 内部，成员们分享了 “Advanced RAG 01 - Small to Big Retrieval” 的链接，提供了关于 RAG 的详细见解。“对比 Embeddings（contrastive embeddings）”的概念以及 LLMs 在生成此类 Embeddings 中的应用是感兴趣的话题，这表明人们正在寻找超越传统余弦相似度的创新。

LAION Discord

Copilot 中的 Codex 解密: Microsoft Codex 现在可以在 Copilot 应用中免费访问，集成了 Jupyter Notebooks 以及 simpy 和 matplotlib 等库，从而实现更具资源优势的代码编写环境。

DALL-E 3 数据集的新家: 关于 DALL-E 3 数据集 从 Hugging Face 移除的困惑已得到解决；它已被重新安置，可通过此直接链接获取。

Grok-1 加入 AI 战场: OpenAI 的 Grok-1（注：原作者误写，实为 xAI）是一个令人印象深刻的 314B 参数模型，它隆重登场，在各种基准测试中表现出色。它在 GitHub 上的发布引起了人们的兴趣，并与 Mixtral 和 LLaMA 等模型进行了比较，可在此处进行探索。

提升 LLM 的高效方法: 一篇 arXiv 论文讨论了成本效益高的方法，如学习率预热（learning rate warming）和先前数据的回放（replay），用于在不进行完整重新训练的情况下更新 LLMs。

关于 GPT-4 的猜测性传闻: 继 Nvidia 的暗示之后，关于 GPT-4 是一个 1.8 万亿参数的混合专家（MoE）模型的猜测不绝于耳。GPT-4 细节的真实性尚未得到证实，该话题是由一张推特图片引发的。

CUDA MODE Discord

光子芯片超越传统硅芯片：Anastasia 的视频引发了关于比传统芯片快千倍的技术热议，同时还提到了 Asianometry 频道等资源，供寻求硅光子（silicon photonics）和光基网络深入知识的爱好者参考。

Triton 调试实现可视化：工程师们分享了一个用于简化 Triton 调试的新可视化工具，以及一套用于深化知识的 Triton Puzzles，可在 Google Colab 上进行试用。

CUDA 社区揭秘调度器奥秘：深入讨论探讨了 CUDA 的 warp 调度器和内存管理策略的细微差别，引发了关于 ProducerProvides, ConsumerTakes、异步工作（async work）和流同步（stream synchronization）复杂性的对话。

学术界的可重构计算：成员们关注了用于高效 ML 的可重构计算这一学术领域，这主要由 Prof. Mohamed Abdelfattah 的工作和 ECE 5545 课程大纲推动，尽管对教科书细节存在一些困惑，但通过参考该课程的第一节讲座视频得到了解决。

赶上 CUDA 进度：为新加入的 CUDA 爱好者提供了指导，推荐了《Programming Massively Parallel Processors》等书籍（可在 Amazon 购买），并鼓励利用 torch 等框架步入 ML/DL 领域。

关于 Striped Attention 和 Flash Attention 的深入讨论：一场关于 Attention 机制的良性辩论探讨了 Ring Attention 和 Flash Attention 不同的内存需求，包括建议查阅特定文献（Striped Attention 论文）和代码（GitHub 实现）以进行澄清。

AI 与系统在 MLSys 2024 交汇：工程师们交流了关于 MLSys 2024 会议的细节，强调了其在机器学习（Machine Learning）与系统（Systems）融合以应对新兴 AI 挑战方面的关键作用（MLSys Conference）。

为 GTC 聚会做准备：Gautier 最狂热的 AI 爱好者们正在组织 GTC 2023 的聚会，讨论访问计划并分享联系方式，同时也对参加此类独家活动的限制表达了一些幽默的调侃。

OpenRouter (Alex Atallah) Discord

LLaMa 模型与 Prompt 配合良好：确认 LLaMa 模型能够很好地处理以 “system”、”user” 和 “assistant” 角色构建的 Prompt，这对使用 OpenAI JavaScript 库的用户非常有用。

脚本将书籍拆解用于 AI 分段：开发了一个创新脚本，可将书籍拆解以进行 AI 驱动的分段生成；通过 Airoboros 70B 测试并与 lzlv 70B 对比显示，在使用基于指令的数据时，生成质量有显著提升。

对深度使用分析的需求增加：讨论强调了社区对类似于 OpenAI 提供的详细使用分析的需求，特别关注每日或每周使用成本等见解，并按模型和应用程序进行细分。

模型变得“难以捉摸”：注意到最近模型行为的变化，特别是模型执行任务的意愿有所下降，同时出现了关于访问 sonnet:beta 和 opus:beta 等测试版模型的问题。公司确认应该有通用访问权限。

为民所用、由民所创的 API：一位用户计划首次推出一个公共 API，并寻求将其包含在 OpenRouter 的列表中，平台对此做出了积极回应，渴望通过私信交流更多细节。

LangChain AI Discord

API 演进引发好奇：工程师们正在质疑 LangChain 的 astream_log 的未来，因为 astream_events 处于 beta 状态；担忧主要围绕潜在的弃用或两者在用例上的区别。

Rubik’s AI 等待热心测试者：Rubik’s AI 正在招募 Beta 测试者，这是一个极具前景的研究助手，提供对 Claude 3 Opus、GPT-4 Turbo 和 Mistral Large 的访问。感兴趣的人可以加入候补名单。

LangChain JavaScript 流式传输遇到障碍：有报告称 JavaScript 中的 RemoteRunnable 存在流式传输问题，这与其在 Python 中的功能表现不同。社区正在寻求见解或修复方案，并建议在 GitHub 和 LangChain 的安全指南上进行跟进。

社区展示多样化的 AI 创作：创新者们推出了各种 AI 工具：一个用于数据分析的 AI 聊天机器人 (Haste171/langchain-chatbot)，管理 Raindrop.io 书签的 Living Bookmarks 机器人，关于 NeuroFusion 生产力的访谈邀请，一个流行的基于 AI 的爬虫 Scrapegraph-ai，以及用于模拟销售角色的 Lyzr.ai’s Automata (GitHub Repo)。

AI 学习变得触手可及：YouTube 教程 (Nutriheal Demo) 分享了关于使用 Langchain’s Pebblo 创建注重隐私的个性化营养 AI 的教学资源，同时还包括本地部署 AI 解决方案、利用通用 UI 构建 AI 助手，以及开发具有战略能力的“计划并执行”风格 AI Agent 的文档 (Langgraph Tutorial)。

Interconnects (Nathan Lambert) Discord

通过 API 揭开模型奥秘：一篇 arXiv 论文讨论了对受 API 保护的大语言模型 (LLMs) 的查询如何可能泄露专有信息（如模型大小）—— 这是一个意外的 “softmax bottleneck”。人们对这些发现的准确性提出了担忧，特别是当模型使用 MoE 等技术时，这可能会扭曲大小估算。

开源定义引发争议：一场 Twitter 对话引发了机器学习社区关于什么是“开源”的争议预测。这引发了关于是否应将数据纳入开源软件定义的讨论，并推动在术语边界上建立务实的共识。同时，人们对 EleutherAI 的社交媒体互动策略表示不满。

Grok-1 加入模型盛宴：xAI 推出了 Grok-1，一个 3140 亿参数的 MoE 模型，引发了围绕其发布、性能指标（传闻超过 Falcon）及其营销策略的讨论。有人对基于种子（torrent）的发布方式表示怀疑，认为这会影响开源 AI 模型的声誉和政策，甚至有人开玩笑地提出通过邮寄物理硬盘来运送模型。

Alignment Lab AI Discord

对 Aribus 进展的困惑：一名成员寻求关于使用 Aribus 开发的见解，并分享了一个 Twitter 链接，但在频道内未收到进一步的细节或澄清。
寻找精通 HTTP 的 Embeddings：有人表示有兴趣寻找在 HTTP 响应上训练的 Embeddings 模型，并建议可能采用经过适当训练的 Transformer 模型来完成此任务。
寻求 Mistral 的微调模型：有人询问是否有一个同时使用 orca-math-word-problems-200k 数据集 和 nvidia/OpenMathInstruct-1 进行过微调的 Mistral 模型，然而，目前还没有关于此事的后续建议。
协作增强 Grok 1 的号召：协作微调 Grok 1 的行动号召提到了对大量 算力 (compute) 和 数据资源 的需求，并提到 MoE 训练基础设施可用于支持这些努力。
Grok 1 基准测试担忧与惊人表现：Grok 1 在 MMLU 上的基准测试表现，以及在高中期末考试数据集中与 GPT-4 和 Claude 接近的表现引发了讨论，提出了关于其能力以及进一步训练对大规模算力和多样化数据的持续需求的问题。

LLM Perf Enthusiasts AI Discord

Devin 引发关于应用复杂性的辩论：一名成员幽默地表示，Devin 启发了他们在应用开发中优先考虑简洁性，并暗示复杂的应用程序可能是不必要的。
神秘推文引发 Anthropic 阴谋论：一条指向推文的链接引发了担忧，认为 Anthropic 可能正在利用其 AI 来影响技术人员，暗示这可能是一种受控反对派（controlled opposition）的伪装。
Claude Sonnet 迈向新高度：公会中的某人正考虑在一个高用量项目中使用 Claude Sonnet，并对其他人在每月数千万 tokens 规模下使用该 AI 的经验感到好奇。
解码 KPU 炒作：对话揭示了对 Knowledge Processing Unit (KPU) 声明的怀疑，辩论了其与 GPT-4 基准测试对比的有效性。Maisa 的 CEO 在 Twitter 上澄清，KPU 是一种增强现有 LLM 的架构方法，而非一个新模型。
OpenAI 频道中未完成的事项：#openai 频道中提到了一段孤立的链接，未提供进一步的上下文。

DiscoResearch Discord

德语语言学故障排除：用户在 DiscoLM-mixtral-8x7b-v2 上遇到了困难，特别是在 instruction fine-tuning 后生成德语回复时；一人概述了使用 AutoModel 进行序列分类时出现的 ValueError，暗示存在配置问题。社区还讨论了模型合并、数据集质量和 prompt 一致性，强调了在模型集成过程中保持语言质量的挑战。
显微镜下的 Grok：社区在 GitHub 上分享了 Grok 模型发布，探讨了由于其庞大的参数量（3140 亿）及随之而来的计算需求，部署该模型的可行性。
评估德语模型掌握程度：对话引用了诸如 supergleber-german-language-evaluation-benchmark 等基准测试，并提到了提供更多信息的 Reddit 帖子和论文。参与者主张在评估平台中创建针对德语的特定基准测试，强调了母语者对语言质量洞察的必要性。
语言卓越大学联盟：有一项提议建议利用德国公立大学的资源来开发能更准确评估语言质量的基准测试，这在扩展 DiscoLM 项目的引用中被提及，并倡导学术伙伴关系的价值。
演示的乐趣与困境：jp1 分享了在无需特殊调整的情况下在演示中使用 fastchat/VLLM 的细节，同时也注意到演示服务器从个人托管迁移到专业托管，不幸地导致了网络问题。chromix 提供了一个轻松的对比，暗示更“专业”的托管环境并不总是意味着更高的可靠性。

Datasette - LLM (@SimonW) Discord

Prodigy 的新 Prompt Engineering 功能：Prodigy 现在包含了 prompt engineering 工具，可将此任务转化为数据标注问题。感兴趣的用户可以在 Prodigy 功能页面探索该产品。
Prompt Engineering 的开源辅助工具：工程社区分享了指向 hegelai 的 PromptTools 和 PromptFoo 的链接，鼓励探索这些资源用于 prompt 测试以及处理多个 LLM 和 vector databases。
模型基准测试和 Prompt 版本控制 UI 出现：Vercel 的 AI Playground 被引用为使用相同 prompts 比较不同 AI 模型的工具，而 Helicone.ai 新兴的 prompt 管理和版本控制功能也正获得认可。
AI 增强博客定制尝试：一名成员承担了一个使用 GPT-3.5-turbo 将博客内容适配到不同 personas 的项目，在线演示可见于 How to Build a Buzzword，介绍了用于增强写作重点和清晰度的潜在工具。
探索 AI 在博客中的角色：讨论围绕 AI 增强的博客功能展开，例如以不同的 personas 重写、生成反驳观点、基于 persona 的内容分享，以及提供摘要或翻译。

Skunkworks AI Discord

模型增强方法正在开发中：一种旨在提高全局准确率 (global accuracy)和训练效率的新方法正在准备发布，待改进的图表和结果生成后即可面世。
呼吁进行大规模实证验证：讨论强调，虽然观察到了令人期待的结果，但由于缺乏计算资源，该方法在大规模模型上的有效性实证验证陷入停滞。
提供扩展支持：有人提议讨论这一前景广阔的方法，并探索投入计算资源 (compute and resources)来验证并对其进行扩展。
在 CIFAR100 上观察到显著提升：在 CIFAR100 的子集上使用 VGG16 进行一个 epoch 的训练，该方法实现了显著更高的测试准确率，展示了初步的成功。
讨论图表报告故障：对话涉及了 Wandb 的技术问题，特别是如何在绘制新实验数据时通过重置步数 (steps) 来有效地更新图表。

PART 2: 频道详细摘要与链接

Stability.ai (Stable Diffusion) ▷ #announcements (1 条消息):

推出 Stable Video 3D：Stability.ai 宣布发布 Stable Video 3D，这是一个基于 Stable Video Diffusion 构建的模型，提供了增强的 3D 质量和多视角能力。它通过输入单张图像并输出多个视角，可用于生成 3D 网格 (3D meshes)；了解更多关于 Stable Video 3D 的信息。
优于之前的模型：SV3D 的发布标志着其性能优于 Stable Zero123 和其他开源替代方案（如 Zero123-XL），承诺大幅提升 3D 技术的质量。
发布了两个新的 SV3D 变体：Stability.ai 发布了两个变体：SV3D_u 用于从单张图像生成轨道视频（无需相机调节），以及 SV3D_p，它在这些功能的基础上扩展了更多特性。

提及的链接：Introducing Stable Video 3D: Quality Novel View Synthesis and 3D Generation from Single Images — Stability AI：当我们发布 Stable Video Diffusion 时，我们强调了视频模型在各种应用中的多功能性。在此基础上，我们很高兴发布 Stable Video 3D。这是一款新模型…

Stability.ai (Stable Diffusion) ▷ #general-chat (988 条消息 🔥🔥🔥):

AI 聊天机器人（目前）还不会写代码：一位成员对运行 Stable Cascade 的代码表示沮丧，认为其优化很差，可能由聊天机器人编写。他们指出运行 Cascade 的时间比 SDXL 长得多，且 CPU 负载显著。
社区期待 SD3 的访问权限：在对 Stable Diffusion 3 (SD3) 的期待中，社区成员正热切等待更多消息和访问权限，传闻称邀请函可能很快发出。大家猜测并希望 SD3 能在现有模型的基础上改进 prompt 遵循能力。
Stability AI 转向加密货币的潜在倾向引发关注：关于 Stability AI 与区块链和加密货币公司合作的消息引起了社区成员的关注。他们对可能背离开源原则、转向安全性较低且易发诈骗的加密货币集成表示忧虑。
在有限的硬件上运行 AI 模型：成员们讨论了在消费级硬件上运行高级 AI（如 Cascade 或 SD3）的挑战，并比较了不同 GPU 的体验。有人指出，与大型语言模型 (LLM) 相比，图像模型通常对 VRAM 的需求较低。
对实用 AI 生成工具的需求日益增长：社区成员渴望能简化训练或微调过程且不牺牲结果质量的 Stable Diffusion 工具。咨询范围从如何在有限资源下更有效地运行，到针对特定用例（如游戏资产创建）进行微调的潜力。

提及的链接：

grok-1: Grok-1 是一个拥有 314B 参数的 Mixture of Experts 模型 - 基础模型（未经微调） - 8 个专家（2 个激活） - 86B 激活参数 - Apache 2.0 许可证 - 代码： - 祝编码愉快！另：我们正在招聘：
coqui/XTTS-v2 · Hugging Face: 未找到描述
Iron Man Mr Clean GIF - Iron Man Mr Clean Mop - Discover & Share GIFs: 点击查看 GIF
Avatar Cuddle GIF - Avatar Cuddle Hungry - Discover & Share GIFs: 点击查看 GIF
PollyannaIn4D (Pollyanna): 未找到描述
Yess GIF - Yess Yes - Discover & Share GIFs: 点击查看 GIF
pickle — Python object serialization: 源代码：Lib/pickle.py。pickle 模块实现了用于序列化和反序列化 Python 对象结构的二进制协议。“Pickling”是将 Python 对象层级结构转换为...的过程。
NVLink | pny.com: 未找到描述
Stable Video Diffusion - SVD - img2vid-xt-1.1 | Stable Diffusion Checkpoint | Civitai: 查看我们的快速入门指南！ https://education.civitai.com/quickstart-guide-to-stable-video-diffusion/ 基础 img2vid 模型经过训练用于生成...
The Complicator's Gloves: 优秀的软件在多个方面不断受到攻击。首先是“业余爱好者”，他们尽管只读完了《傻瓜编程》，却不知何故设法拿到了那份巨额合同...
Introducing Stable Video 3D: Quality Novel View Synthesis and 3D Generation from Single Images — Stability AI: 当我们发布 Stable Video Diffusion 时，我们强调了视频模型在各种应用中的多功能性。在此基础上，我们很高兴发布 Stable Video 3D。这个新...
Proteus-RunDiffusion - withclip | Stable Diffusion Checkpoint | Civitai: 介绍 Proteus-RunDiffusion。在开发 Proteus-RunDiffusion 的过程中，我们的团队开展了一个探索性项目，旨在提升...的能力。
Page Not Found | pny.com: 未找到描述
Reddit - Dive into anything: 未找到描述
WKUK - Anarchy [HD]: 最具喜剧色彩的经济无知。—— Murray Rothbard 的《自由、不平等、原始主义和分工》(http://mises.org/daily/3009)。—— "Th...
Короткометражный мультфильм "Парк" (сделан нейросетями): 短篇动画《公园》（由神经网络制作）- 一部非常引人入胜的短篇动画，使用神经网络创作。
GitHub - mix1009/sdwebuiapi: Python API client for AUTOMATIC1111/stable-diffusion-webui: 用于 AUTOMATIC1111/stable-diffusion-webui 的 Python API 客户端 - mix1009/sdwebuiapi
Vancouver, Canada 1907 (New Version) in Color [VFX,60fps, Remastered] w/sound design added: 我为这段 1907 年加拿大温哥华的视频进行了上色、修复，并添加了天空视觉效果和音效设计。这段视频是在有轨电车上拍摄的，这些...
GitHub - DiffusionDalmation/pt_to_safetensors_converter_notebook: This is a notebook for converting Stable Diffusion embeddings from .pt to safetensors format.: 这是一个用于将 Stable Diffusion 嵌入（embeddings）从 .pt 格式转换为 safetensors 格式的 notebook。 - DiffusionDalmation/pt_to_safetensors_converter_notebook
The Mushroom Motherboard: The Crazy Fungal Computers that Might Change Everything: 揭开真菌计算的秘密！发现真菌作为生物计算机的惊人潜力。从“森林互联网”到非常规计算...
Home: Stable Diffusion web UI。通过在 GitHub 上创建账号，为 AUTOMATIC1111/stable-diffusion-webui 的开发做出贡献。
GitHub - Stability-AI/generative-models: Generative Models by Stability AI: Stability AI 的生成模型。通过在 GitHub 上创建账号，为 Stability-AI/generative-models 的开发做出贡献。
GitHub - chaojie/ComfyUI-DragAnything: 通过在 GitHub 上创建账号，为 chaojie/ComfyUI-DragAnything 的开发做出贡献。
GitHub - GraftingRayman/ComfyUI-Trajectory: 通过在 GitHub 上创建账号，为 GraftingRayman/ComfyUI-Trajectory 的开发做出贡献。
在 Mac OS (M1, M2 或 M3) 上安装 ComfyUI: 本视频是一个快速演练，展示如何在 M1 或 M2 Mac 上本地安装 ComfyUI。了解更多关于 AI Animation 的信息，并注册为 AI ...
Regional Prompter: 在 Stable Diffusion 中控制图像构图 - Stable Diffusion Art: 你知道可以为图像的不同区域指定提示词吗？你可以通过 Regional Prompter 扩展在 AUTOMATIC1111 上实现这一点。

Perplexity AI ▷ #announcements (1 条消息):

Pro 用户可无限次查询 Claude 3 Opus: 公告透露，Perplexity Pro 用户已获得 Claude 3 Opus 的每日无限次查询权限，该模型被声称是目前可用的最佳大语言模型 (LLM)。Pro 用户从现在起可以充分利用这一优惠。

Perplexity AI ▷ #general (795 条消息 🔥🔥🔥):

Perplexity Pro 的困惑: 用户对 Perplexity AI 的上下文限制和“无限”声明表示困惑。对话中提到了对 Pro 搜索使用的误解，重点在于 Perplexity 的描述需要更加清晰。
Claude 3 Opus 讨论: 用户讨论了 Claude 3 Opus 在 Perplexity AI 中的能力和集成情况，并将其与 GPT-4 及其他模型进行了比较。对话集中在该模型“无限”使用的奥秘以及任何潜在的上下文限制上。
育儿与 AI: 一场关于 AI 在向儿童解释复杂话题中作用的热烈辩论爆发了，一位用户主张利用它来简化概念。讨论还涉及儿童的发展能力以及 AI 在教育中的优势。
关于 AI 响应能力的辩论: 用户讨论了 AI 遵循特定提示词的能力，分享了在尝试指示 AI 提供简洁回答或针对儿童问题定制内容时遇到的见解和挑战。
潜在的合作伙伴关系与更新: 围绕苹果、谷歌和生成式 AI 领域的潜在合作伙伴关系及集成出现了猜测，用户分享了新闻链接以及对公司战略的看法。

提及的链接:

Apple 的 AI 雄心可能包括 Google 或 OpenAI：另一项重大的 Apple / Google 交易可能即将达成。
Aravind Srinivas (@AravSrinivas) 的推文：我们已经为 Perplexity Pro 用户取消了 Claude 3 Opus（目前市场上最好的 LLM）的每日查询次数限制！尽情享受吧！
Aravind Srinivas (@AravSrinivas) 的推文：是的，感谢 @elonmusk 和 xAI 团队开源了 Grok 的基础模型。我们将针对对话式搜索对其进行微调并优化推理，并将其提供给所有 Pro 用户！ ↘️ Quoti...
未找到标题：未找到描述
Shikimori Shikimoris Not Just Cute GIF - Shikimori Shikimoris Not Just Cute Shikimoris Not Just A Cutie Anime - 发现并分享 GIF：点击查看 GIF
Nothing Perplexity 优惠：在 Nothing，我们正在构建一个让科技再次变得有趣的世界。还记得每个新产品都让你感到兴奋的时光吗？我们正在带回那种感觉。
Brivael (@BrivaelLp) 的推文：Zuck 刚刚对 Grok 的发布做出了回应，他似乎并不感冒。“3140 亿参数太多了。你需要一堆 H100，而我已经把它们都买光了” 🤣
Bloomberg Technology (@technology) 的推文：独家：Apple 正在洽谈将 Google 的 Gemini AI 引擎内置到 iPhone 中，这可能是一项重磅交易 https://trib.al/YMYJw2K
✂️ Sam Altman 谈 AI LLM 搜索：47 秒 · 由 Syntree 剪辑 · 原始视频 "Sam Altman: OpenAI, GPT-5, Sora, Board Saga, Elon Musk, Ilya, Power & AGI | Lex Fridman Podcast #419"
这些公司在隐藏什么？：关于 Rabbit R1 和 Humane Ai Pin 的看法。如果你想支持本频道，可以考虑点击上方的“加入”按钮成为 Dave2D 会员！http://twit...
FCC ID 2BFB4R1 Rabbit Inc. 的 AI Companion：Rabbit Inc. 为 AI Companion 提交的 FCC ID 申请，ID 为 2BFB4R1。包含批准的频率、用户手册、照片和无线报告。

Perplexity AI ▷ #sharing (35 条消息🔥):

使用 Claude 3 Opus 进行创意探索：使用 Claude 3 Opus 进行了一个名为“不断增加智能直到人类无法理解”的有趣创意写作实验。可以在这里进一步探索该任务。
可见性是关键：提醒用户确保他们的主题帖已公开分享，以确保社区可见性。说明见 Discord 链接。
关于清洁度的辩论：一场关于哪种选项更干净的讨论引起了兴趣，可以在这里查看。
朝鲜的动态：一项关于朝鲜金氏及其行动的 Perplexity 搜索引起了好奇。富有洞察力的结果可在这里查看。
关于未来的问题：社区分享了关于人类何时可能居住在火星以及其他关于未来的疑问。引人入胜的讨论可在这里查看。

Perplexity AI ▷ #pplx-api (64 条消息🔥🔥):

模型弃用困惑 (Model Deprecation Confusion)：sonar-medium-online 模型原定于 3 月 15 日弃用，但用户观察到它仍然可以正常工作，而不仅仅是重定向到替代模型。关于弃用是在当天结束时生效还是计划有所改变，引发了各种猜测。
API 的得与失 (API Giveth and API Taketh Away)：在使用 sonar-medium-online 时，一位用户发现通过 Web 浏览器获取的新闻与通过 API 获取的新闻之间存在不一致，特别是在关于 Donald Trump 的近期新闻响应上有所不同。
在招聘市场的丛林中寻找链接 (Quest for Links in the Job Market Jungle)：一位用户尝试使用 Perplexity API 获取特定的职位发布链接。值得注意的是，虽然 API 偶尔会提供实际的职位链接，但有时仅返回 LinkedIn 或 Glassdoor 等招聘平台的链接。
与 Token 共舞：最大还是最小？ (Dancing with Tokens – Max or Min?)：讨论了设置 maxtokens 参数如何影响 API 的响应。共识显示，如果设置得太低，API 可能会提供不完整的响应；如果设置得太高，它可能不会利用所有可用空间，这表明模型不会“填充”额外空间，而是专注于生成完整的响应。
寻找来源与引用 (Seeking Sources & Citations)：关于 URL 引用的对话确认该功能仍处于 beta 阶段，并为感兴趣的人提供了申请表链接。此外，还讨论了目前“Pro”用户从封闭测试版访问 URL 引用的情况，用户分享了申请链接和模型性能比较的讨论。

Links mentioned:

pplx-api: no description found
pplx-api form: Turn data collection into an experience with Typeform. Create beautiful online forms, surveys, quizzes, and so much more. Try it for FREE.

Unsloth AI (Daniel Han) ▷ #general (853 messages🔥🔥🔥):

Grok 1：巨兽出笼 (Grok 1: The Behemoth Unleashed)：Elon Musk 发布了 Grok 1，这是一个拥有 3140 亿参数的 Mixture-of-Experts 模型，因其庞大的体积和对大多数用户而言的不切实际性引发了讨论。该模型被预期为训练不足，性能略低于 Miqu，略高于 Llama2 70b，与 Mixtral 相当。
QLoRA 的超参数 (Hyperparameters for QLoRA)：在 Mistral-7b 上微调 QLoRA 的首选超参数似乎是 2e-4 的学习率和最多 3 个 epochs，正如 Unsloth 的 notebooks 中所建议的那样。不过，鼓励用户根据具体任务和数据集调整这些设置。
Discord 中的冒充预警 (Impersonation Alert in Discord)：用户报告了一个在 Discord 上冒充 Daniel Han (starsupernova) 的诈骗账号。已向 Discord 提交报告，提醒用户警惕来自该冒充者的好友请求，并在遇到时进行举报。
新工具与集成 (New Tools and Integrations)：AIKit 引入了与 Unsloth 的微调集成，为用户提供了使用配置文件微调语言模型的能力，并能使用 Docker 创建兼容 OpenAI 的模型镜像。建议使用 WandB (Weights & Biases) 来监控和可视化训练数据。
理解量化 (Understanding Quantization)：社区对理解语言模型的量化 (Quantization) 持续关注。4-bit BnB quantization 通过减少每个权重的位数来减小模型体积，但也有人寻求学习量化的资源。社区成员还在寻求指令微调 (instruction tuning) 的微调指南和数据集结构。