2024年3月19日-3月20日 AI 新闻简报。我们为您查看了 358 个 Twitter 账号和 21 个 Discord 社区（包含 337 个频道和 9841 条消息）。预计为您节省阅读时间（以 200wpm 计算）：1033 分钟。

人们常说，初创公司走下坡路的一个关键信号是“发布即跑路（shipping and dipping）”——即那些决定离职的顶尖人才，倾向于在发布完某些成果后，在职业生涯的高光时刻离开。这种情况刚刚在以下两家公司同时发生：

Inflection AI：两周前刚刚发布了 2.5 版本（性能达到 GPT-4 的 94%），现在两位执行联合创始人宣布加入 Microsoft；
Stability AI：两周前刚刚发布了 Stable Diffusion 3，现在 Rombach 等人宣布离职。

高层离职在混乱的初创公司中是常态，但这两起事件确实比大多数情况更具震撼力。这可能是“热门”/“GPU-rich”初创领域整合/降温潮的开始，但我们现在下定论还为时过早。不过，请保持警惕。

[TOC]

第一部分：AI Twitter 汇总

所有摘要由 Claude 3 Opus 完成，取 4 次运行中的最佳结果

Microsoft AI

@mustafasuleyman: Mustafa Suleyman 加入 Microsoft 担任 Microsoft AI 的 CEO，领导 Copilot、Bing 和 Edge 等消费级 AI 产品和研究 (350万阅读量)
@yusuf_i_mehdi: Microsoft Azure 和 NVIDIA 的 Grace Blackwell 200 Superchip 正在展开合作 (8千阅读量)
@saranormous: Satya Nadella 收到了 Sara Norman 关于 Mustafa Suleyman 加入 Microsoft 的贺卡 (2.1万阅读量)
@kylebrussell: Mustafa Suleyman 加入 Microsoft 看起来像是一场奇怪的收购，可能是出于监管或成本原因 (1.3万阅读量)

Inflection AI

@inflectionAI: Inflection AI 宣布重要更新，公司开启新阶段 (50.5万阅读量)
@vikhyatk: Inflection AI 在不到一年前以 40 亿美元的估值融资 13 亿美元 (7.8万阅读量)
@kylebrussell: Inflection AI 的投资者和早期员工感觉被“过河拆桥”了 (3.8万阅读量)
@inflectionAI: Inflection AI 2.5 很快将通过 API 提供，以加速其为每个人创建个人 AI 的使命 (3.6万阅读量)

Google DeepMind

@GoogleDeepMind: Google DeepMind 发布 TacticAI，这是一款能为足球专家提供角球战术见解的 AI 助手，由利物浦足球俱乐部合作开发 (37.3万阅读量)
@GoogleDeepMind: 八年前，AlphaGo 击败世界冠军李世石，成为首个在围棋比赛中战胜人类顶尖高手的 AI，创造了历史 (10.9万阅读量)
@GoogleDeepMind: TacticAI 使用几何深度学习方法来解决英超联赛比赛中角球数据有限的问题 (3.1万阅读量)
@GoogleDeepMind: 在一项盲测中，足球专家发现 TacticAI 的建议与真实的角球战术无法区分，并且在 90% 的情况下更倾向于它的战术建议 (2.1万阅读量)

Anthropic

@AnthropicAI: Anthropic 的 Claude 3 Haiku 和 Claude 3 Sonnet 现已在 Google Cloud 的 Vertex AI 平台上全面开放，Claude 3 Opus 也即将推出 (10.2万阅读量)
@abacaj: Anthropic 在 Claude 3 模型上表现惊艳 (3.1万阅读量)
@abacaj: 与 GPT-4 不同，Claude 可以根据不在训练集中的新文档编写可运行的代码 (8千阅读量)
@abacaj: 在去年的模型表现平平之后，Anthropic 凭借 Claude 3 模型完成了自我救赎 (4千阅读量)

AI 安全与风险

@AISafetyMemes: NVIDIA 宣布推出 AI 护士，成本比人类低 90%，且在床边护理表现上优于人类，引发了对失业和 AI 进展的担忧 (7.7万次观看)
@ClementDelangue: 权力集中是 AI 领域最大的风险 (6.2万次观看)
@AISafetyMemes: Zvi Moshowitz 警告像 Devin 这样能够制定计划、处理障碍并可能导致递归自我改进 (recursive self-improvement) 的 AI 系统的风险 (2.5万次观看)
@abacaj: AGI 掌握在单一组织手中正变得越来越有可能，这让 Aiden Gomez 彻夜难眠 (2.5万次观看)

AI 基准测试与评估

@yanndubs: AlpacaEval 现在受长度控制 (length-controlled)，与 Chat Arena 的相关性达 0.98，解释简单，且对长度博弈 (length gamification) 具有鲁棒性 (3万次观看)
@deliprao: Grok 的表现似乎并不优于规模小一个数量级的 Mixtral (9千次观看)
@yanndubs: AlpacaEval 默认使用长度控制，但仍会显示非 LC 指标 (547次观看)
@deliprao: 由于对新型基准测试 (benchmarking) 方法投入不足，目前的 LLM 开发效率并未达到应有的水平 (894次观看)

AI 助手与 Agent

@aryxnsharma: Induced AI 正在开放首个公开且免费的自主 Web Agent API 的早期访问 (1.5万次观看)
@aryxnsharma: 浏览器 Agent 是构建完整数字远程员工的入口 (2千次观看)
@yoheinakajima: Yohei Nakajima 的 Agent 会记录内部函数调用，包括时间、类型、名称、参数和结果 (1.4千次观看)
@aryxnsharma: 一位 Induced AI 的早期用户使用他们的 Agent API 构建了一个 macOS 菜单栏 (497次观看)

AI 编程助手

@svpino: 未来，编程可能会成为一种爱好，因为构建软件将更多地关乎解决问题和思考，而非编写代码 (9.3万次观看)
@LangChainAI: LangChain 和 Modal 正在举办一场关于如何在生产环境中无痛构建代码 Agent 的网络研讨会 (8.5千次观看)
@corbtt: 下一代编程助手将在亚马逊“六页纸 (six-pager)”详细设计文档的抽象层级上运行 (537次观看)
@rameerez: Ramiro Berrelleza 通过下载 Markdown 格式的 Hotwire 文档并将其输入 GPT，制作了一个专门的 GPT (234次观看)

AI 数字人与视频

@suno_ai_: Suno AI 正在发布其音频生成模型 V3 版本 (19.7万次观看)
@AravSrinivas: Suno AI 是下一个 AI 独角兽，具有惊人的迭代速度和音质，且越来越多地被用来替代 Spotify (32.7万次观看)
@synthesiaIO: Synthesia 因其 AI 视频和 Avatar 技术被《快公司》(Fast Company) 评为最具创新力的公司之一 (1千次观看)
@AssemblyAI: 新的 AI 驱动内容创建工具层出不穷，涵盖视频、播客、Avatar 等领域 (812次观看)

迷因与幽默

@nearcyan: 生活中未被充分利用的策略迷因 (41.7万次观看)
@AISafetyMemes: 关于 AI 的“这就是魔法”迷因 (1.9万次观看)
@DeepLearningAI: 关于 AI 生成视频看起来不酷的迷因，最初来自 Reddit 上的 /ProgrammerHumor 板块 (7千次观看)
@AISafetyMemes: 关于根据 Claude 的消息生成的 AI 死亡金属歌曲的迷因 (7千次观看)

PART 0: 摘要之摘要之摘要

我们得出结论，Claude Opus 是顶级摘要的最佳模型，因此我们将停止 A/B/C 测试（有关我们的努力/记录，请参阅存档）。我们将为所有 3 个及更多模型（包括 Gemini 1.5!!）提供并行运行，因为这个问题在拓扑上与我们将要推出的个性化应用相似。

Grok-1 发布引发争论：xAI 在 Apache 2.0 许可证下开源发布了 Grok-1（一个 314B 参数的 Mixture-of-Experts 模型），这引发了广泛讨论。虽然一些人对其潜力感到兴奋，但也有人质疑其在巨大的推理 GPU 需求下的实用性。人们将其与 GPT-4 和 Claude 等其他大模型进行了比较，并对 Grok-1 的训练数据和架构选择进行了推测。
Nvidia 下一代 GPU 预示 AI 进展：有关 Nvidia 即将推出的 GeForce RTX 50 系列 “Blackwell” 显卡将采用 28 Gbps GDDR7 显存 的传闻引起了关注，详见 TechPowerUp 文章。讨论还涉及了 CEO 黄仁勋（Jensen Huang）的 GTC 主旨演讲，可能会确认 GPT-4 的 1.8 万亿参数 Mixture-of-Experts 架构。
显微镜下的 Attention 机制：对 Attention 机制进行了深入研究，特别是围绕 FlashAttention 和 RingAttention 中的 内存缩放特性。分享了一篇关于 Striped Attention 的论文，提出了一种改善因果 Transformer 模型工作负载平衡的方法。此外，还阐明了 Attention 背后的基本动机，例如克服固定长度编码的局限性。
Prompt Engineering 的进展：引入了用于 Prompt Engineering 的新工具，例如 Explosion 的 Prodigy 和开源的 PromptTools。讨论强调将 Prompt Engineering 视为数据标注问题，以及版本管理和模型响应比较功能的重要性。还分享了使用 GPT-3.5-turbo 通过不同 Persona 进行内容翻译的创新实验。
光子芯片有望实现更快的 AI：一段 YouTube 视频强调了 光子芯片 的突破，声称其速度快 1000 倍，并包含了来自光子超级计算机公司 Lightmatter 的见解。讨论了其对 AI 加速和高性能计算的潜在影响。

PART 1: 高层级 Discord 摘要

Stability.ai (Stable Diffusion) Discord

与 Stability AI 一起推出 3D 未来：Stability.ai 宣布了 Stable Video 3D (SV3D)，提升了生成模型领域的能力，能够从单个物体图像生成高质量的多视图图像和 3D 网格。发布了两个变体：SV3D_u 和 SV3D_p，其中 SV3D_u 专门用于生成轨道视频，而后者扩展了这些功能，详见官方公告。
对 SD3 的期待与日俱增： 社区正在等待 SD3 邀请的发放，同时有推测称其将于 4 月发布；讨论涉及更新以及与区块链公司的合作伙伴关系。
技术人员解决 AI 模型怪癖：参与者分享了运行不同 Stable Diffusion 模型的经验和技术挑战，提到了效率低下和需要 AVX 指令集的问题，并针对各种硬件设置进行了故障排除和优化。
序列化安全与保障：工程师们寻求关于将 .pt 文件转换为 SAFETENSORS 格式的建议，参考了官方 Python 文档中关于使用 Pickle 进行对象序列化相关的安全担忧，详见此处。
辩论 AI 许可的开放性：围绕 AI 模型的商业用途和开源许可展开了讨论，一些社区成员对项目开源后的所有权持自由放任的态度。

Perplexity AI Discord

Perplexity 为 Pro 用户解除限制：Perplexity Pro 用户现在可以享受 Claude 3 Opus 的每日无限次查询，这引发了关于“无限”等营销术语是否具有误导性的辩论。
“无限”是一个神话吗？：工程师们正在审视 Perplexity 的“无限”声明，认为其可能误导客户。关于实际使用限制的看法存在分歧，讨论还涉及法律影响以及与 Gemini Pro 1.5 的公司增长对比。
AI 作为家庭教师：一些人正在探索使用 Claude 3 Opus 等 AI 模型为儿童进行简单的教育解释，而另一些人则分享了使用 ChatGPT Pro 等 AI 工具促进学习的经验。
技术不一致性与未来技术查询：Perplexity API 行为的不一致性（如不同的响应和对模型弃用的预期）引发了讨论。还有关于集成 Grok 等开源模型以及 API 中图像视觉支持的咨询。
Perplexity 的多样化用例和可见性：Perplexity AI 被用于多种用途，包括创意写作、漏洞管理和技术调查。在 Discord 指南中，有人提醒要正确分享内容，以保持社区的可见性。

Unsloth AI (Daniel Han) Discord

Unsloth AI 在 GitHub 大放异彩：Unsloth AI 透露其本周在 GitHub 趋势榜有名，其 QLoRA 和 LoRA 微调功能具有显著的性能特征，承诺 2-5 倍的速度提升和 70% 的显存节省。社区被鼓励在 Unsloth GitHub 上为该项目点亮星标。
社区对 Grok-1 的评价：xAI 发布了拥有 3140 亿参数的 Grok-1，鉴于其推理对 GPU 需求极高，其实用性引起了人们的质疑。人们好奇这种庞大模型背后的动机是技术进步，还是受 Elon Musk 愿景影响的营销策略。
微调 Epochs 和模型大小讨论：Discord 讨论转向了微调 Epochs，特别是在语音神经网络与 LLM 的背景下，共识暗示 3 个 Epochs 可能是防止风格过拟合的标准。在将可训练参数与数据匹配时，对于约 800,000 行的数据集，建议 Rank 为 32 或 64。
Mistral 与 Gemma 在特定 AI 任务中的对比：对 Mistral-7b 和 Gemma 7b 进行了详细对比，指出了它们在特定领域分类任务中的熟练程度。还讨论了使用 Huggingface Inference API 进行 4-bit 量化时的技术问题，建议使用 Unsloth 的 Colab notebook 以成功执行。
探索 Unsloth AI 的能力与支持：社区积极讨论使用 Unsloth 进行模型微调、转换和部署的细节，重点关注 Mistral 等开源模型。会议确认，虽然全量微调目前不是 Unsloth 的重点，但在未来开发中仍有可能。此外，明确了 eval_steps 参数会影响微调期间评估的频率，但不一定会影响结果。
社区中的诗意与哲学思考：在轻松的氛围中，Unsloth AI 公会分享了一首名为《致猴子的呼吁》(An Appeal to A Monkey) 的诗，探讨了复杂世界中的简单性主题，并保持了包括青少年直观学习案例和偶然发现用户名在内的对话动态。

LM Studio Discord

领域新秀 - Command-R 35B：LM Studio 预计很快将支持 Command-R 35B 模型，目前正等待 llama.cpp pull request #6033 的合并。然而，llama.cpp 尚不支持 c4ai 的兼容性问题仍未解决，详见此处。
Grok-1 的开源争议：拥有 314B 参数的模型 Grok-1 的发布引发了关于其本地使用实用性的讨论，人们对其在没有进一步微调情况下的功能持怀疑态度。更多信息可以在 xAI blog 上找到。
GPU 拉锯战 - 预算 vs 性能：关于运行语言模型硬件的讨论范围广泛，从考虑二手 GPU（如 3090）到使用 MacBooks。有意购买 Epyc CPUs 和旧款 Tesla（如 K80）的用户讨论了其中涉及的技术细节和挑战。
AMD 的 ROCm 障碍：分享了针对 gfx1031 和 gfx1032 的 预构建 Windows ROCm 库 链接 (GitHub - brknsoul/ROCmLibs)。然而，AMD 6700 xt 缺乏对 ROCm 的官方支持，导致与 LM Studio 存在兼容性问题。
触手可及的 LM Studio 配置：寻求 LM Studio 模型配置预设 的用户可以在 GitHub - lmstudio-ai/configs 获取 JSON 文件集合。同时，关于不同 LM Studio 版本功能的讨论仍在继续，而在 Local Inference Server 上实现 JSON function-calling 的呼吁尚未得到解决。

Nous Research AI Discord

RTX 50 “Blackwell” 选用较慢的 GDDR7：NVIDIA 备受期待的 GeForce RTX 50 系列 “Blackwell” 显卡将使用 28 Gbps 的 GDDR7 显存，而非达到 32 Gbps 的极限性能。细节反映出一种类似于 RTX 20 系列显存速度的保守策略，详见 TechPowerUp 文章。
提升 AI 性能的人工魅力：讨论中包含了一些非常规方法，例如利用“特定倾向的 Claude”网络来改进 mermaid 图表，以及通过“话术诱导 (rizzing up)”模型来增强回答效果。复制其他 AI 模型功能的伦理问题也成为了热门话题。
显而易见的问题 —— 模型缩放成本：对话强调了将 AI 模型（如 llama-2 13b 扩展至 20b）进行缩放的巨大成本（300,000 美元）和实用性担忧。尽管成员们对 200 亿参数模型超越 Mistral 抱有期待，但对这种增量提升的收益持怀疑态度。
Grok-1 在 AI 巨头中的地位辩论：拥有 314B 参数的 Grok-1 引发了讨论，被认为仅比 GPT-3.5 略强，且与较小的 7B 参数模型相比竞争力不足。NVIDIA CEO 黄仁勋可能无意中确认了 GPT-4 拥有 1.8 万亿参数。与此同时，允许 Yi-9B 商业化的许可变更以及对 Mixtral 等模型进行持续预训练的价值，引发了关于 AI 演进实际策略的辩论。
开源 vs 商业 AI 模型：反思了商业限制巨头可能对开源 AI 造成的压制，暗示未来实体可能会定制大语言模型以体现其核心价值观。这一论述设想由开源模型提供坚实基础，以支持 AI 系统的持续开发和扩展。
模型困惑度与剪枝前景：技术交流包括计算 Llama2 困惑度 (Perplexity) 的复杂性，以及创建大型模型的剪枝 (Pruned) 版本，例如 Smallstral（Mistral-7B-v0.1 的缩减版）。Bittensor 等合作伙伴在链问题和追求用于网络活动的交易代币 (tao) 方面面临障碍。
RAG 的理想未来与模式：对 RAG (Retrieval-Augmented Generation) 模型的愿景建议采用类 Markdown 的输出和高级推理能力。成员们讨论了模型回答的平衡性，即在依赖内部知识与利用排他性外部上下文或“RAG 模式”之间切换。有人提议通过 Cohere 的跨度高亮 (span highlighting) 整合外部上下文，作为增强 RAG 效用的手段。

Eleuther Discord

触手可及的常春藤盟校课程：常春藤盟校的课程现在可以通过网络公开获取，其中特别提到了斯坦福大学关于 NLP 的 CS 视频。技术社区对这种高端教育资源的民主化表示赞赏。
各种新奇工具与设备：讨论中重点介绍了引人注目的技术，如 Devin AI 软件工程师 和由 OpenAI 提供技术支持的机器人 Figure 01。此外，还提到了 AI ThoughtStream 概念 以及 Self-Taught Reasoner (STaR)，更多见解可见于相关论文。
了解 Grok：Grok-1 在 GitHub 上的发布引发了将其与 Claude 和 GPT-4 进行对比的辩论，强调了对独立 Benchmark 和微调（finetuning）见解的需求。会议还提出了对 AI 模型评估指标的担忧，并强调使用 EleutherAI 用于计算 TFLOPs 的 cookbook。
规模经济：公会内的讨论涉及了成本可负担性，例如向 TMLR 提交 AI 论文（这是一个免费的会议投稿选项），以及 Pythia-70M 等模型的经济化训练时间。普遍共识认为 NVIDIA 的性能数据和研究，如 Optimizing Distributed Training on Frontier for Large Language Models，为假设的时间估算提供了宝贵资源。
数据集复杂度对语言模型的影响：在 #scaling-laws 频道中，成员们讨论了语言模型的 Scaling Laws、数据集复杂度，以及内在熵（intrinsic entropy）和词汇密度等筛选标准对于高效预训练实践的重要性。
字符串采样服务：关于从 n-gram 分布中进行采样的咨询引出了对自回归和分层采样方法的解释，相关的工具和代码示例可以在 GitHub 链接以及关于 n-gram 语言模型的 Wikipedia 页面中找到。
掌控 LLM 评估的混乱：在 #lm-thunderdome 频道中，解决了许多关于 lm-eval-harness 使用和集成的问题，包括默认模型选择行为、评估 Benchmark 的一致性以及死锁问题。用户获悉 lm-eval 0.4.2 版本已在 PyPI 上线，并被鼓励协助进行 PR 评审。
是否对 The Pile 进行打乱 (Shuffle)：在 #gpt-neox-dev 中，有人寻求关于 The Pile 数据集打乱情况的澄清。虽然原始文件未进行打乱，但已明确 Pythia 所使用的 HF 上的预处理数据确实经过了打乱。然而，单个组件可能仍保持按时间顺序排列。

OpenAI Discord

AI 思考其自身的理解力：工程师们就 AI 是否具备某种形式的理解力，还是仅仅在预测词序展开了辩论。他们将 AI 的涌现行为（emergent behaviors）与人类的认知过程进行了类比，并质疑 AI 是否能产生与人类感官体验平行的认知。
辩论 AI 意识：在另一个哲学层面的讨论中，意识成为了 AI 关注的焦点。讨论者们剖析了一个观点，即 AI 可能需要更少的努力来解释，因为它缺乏人类对地位或财富的社会驱动力，这对情感交流具有深远影响。
GPT-4 vs. Claude-3 对决：在关于性能的讨论中，Claude-3 因其对话能力受到称赞，而 GPT-4 则在编程能力方面获得认可。工程师们还在等待新模型的发布或回滚到早期 GPT 版本的选项，同时一些人正在处理技术问题并在 help.openai.com 寻求帮助。
GPT-5 发布传闻与 API 进展：社区对 GPT-5 的发布以及在 GPT API 中启用网页搜索功能的方法感到好奇。他们还在探索在移动平台上创建 AI chatbots，并解决 GPT 过滤器敏感度过高的问题。
在 AI 中 Prompt 出更好的未来：工程师们正在分享对抗 AI 任务拒绝和优化 Prompt 结构的策略，特别是针对 GPT 模型的分类任务。对话内容包括如何处理来自 ChatGPT 等平台响应模式的重大转变，并鼓励对 Prompt 进行系统性测试，以平衡召回率（recall）与误报率（false positives）。

HuggingFace Discord

多 GPU 微调的折磨：一位工程师寻求关于使用多 GPU 微调 cross-encoder 模型的建议，思考在扩展硬件时必要的参数调整。
Aya 的杀手锏：Aya demo 增强了更高的重复惩罚（repetition penalty），并且有开发者呼吁为 Gradio 界面添加滑块功能。
H100 GPU 备受关注：NVIDIA 的 H100 GPU 凭借高达 850W 的巨额功耗以及在单板上集成服务器 CPU 和 GPU 的设计吸引了大量讨论，尽管人们对其漫长的交货周期以及在现代超级计算机机架中满足其电力需求的挑战感到担忧。
Grok-1 以规模和速度令人震惊：新发布的 Grok-1 是一个采用 Apache 2.0 许可证的 3140 亿参数 MoE 模型，其庞大的体量以及登陆 HuggingFace 的速度让许多人感到惊讶。
对 HuggingFace 知识的渴望：初学者和专家都在交流学习 HuggingFace 的资源，分享了该平台的 NLP 课程链接和广受好评的斯坦福 NLP 教科书，同时还有人询问关于可访问、可部署的免费 LLM API（如 ollama）以用于生产环境部署。

LlamaIndex Discord

以交互性重新思考检索：一则推文介绍了一种全新的 RAG 方法，将文档视为交互元素而非静态文本，以便在检索过程中优化响应。
LlamaIndex 更新与集成：LlamaIndex 的 0.10.20 版本现在包含一个 Instrumentation 模块，通过与 @langfuse 的合作，为 RAG pipelines 增加了可观测性，详见此链接和示例 notebook。
Search-in-the-Chain 增强问答：Shicheng Xu 等人的一篇论文建议使用 “Search-in-the-Chain” 来改进问答，通过将检索与规划及重新规划交织在一起，此推文对此进行了进一步讨论。
链接 OpenAI Agents 和查询工具：讨论集中在通过 LlamaIndex 链接多个 OpenAI agents，并引用了 FunctionTool 和 QueryEngineTool 以及遇到的挑战，尽管没有透露错误消息等具体细节。
RAG 与 HuggingFace 模型编排：用户寻求关于使用 Pinecone 进行 RAG 文档准备的建议，并讨论了将 RAPTOR pack 与 HuggingFace 模型（而非 OpenAI 模型）集成的方案，同时分享了来自 llama_index GitHub 仓库的代码。

Latent Space Discord

Yann LeCun 关于视觉与语言推理的辩论升温：LeCun 理论化地认为，由于能够直接映射到动作，视觉模型可能比以语言为中心的模型更具优势。这一观点被归因于他在推文和一次采访中所提到的，他缺乏“内心独白”。

分辨率的新突破：Scene-scenario 开发的 UPSCALER 工具正以 10k 分辨率提升的承诺冲击图像增强市场，正如这篇推文所分享的，这可能会促使 Magnific 重新考虑其定价结构。

Grok-1 隆重登场：xAI 拥有 3140 亿参数的 Grok-1 以 Apache 2.0 协议发布，引发了关于其与其他模型相比潜力的讨论，详见 Grok-1 发布页面和多个 Twitter 线程。

Paper Club 深入探讨大语言模型：#llm-paper-club-west 频道的爱好者们讨论了 Transformer 中 Attention 机制的原理和效率，这有助于理解当前 LLM 的设计和可扩展性。

AI In Action Club 制定学习策略：#ai-in-action-club 展示了使用共享 Google 表格进行的结构化 AI 讨论，提供了关于对比嵌入（contrastive embeddings）的见解，并建议使用 LLM 来改进向量比较。

LAION Discord

Copilot 中的免费 Jupyter，DALL-E 数据集迁移：Microsoft Copilot Pro 订阅者现在可以免费访问带有 simpy 和 matplotlib 等库的 Jupyter Notebooks，类似于 ChatGPT Plus 的功能。DALL-E 3 数据集已迁移到新的 Hugging Face 仓库，可通过 load_dataset() 函数使用，确保了可复现性。
PyTorch 与 xformers 协同：工程师们正在解决 xformers 与 PyTorch 之间的集成问题，讨论指向了使用虚拟环境以及从 PyTorch-index URL 安装兼容版本等解决方案。
元数据魔力提升 AI 字幕生成：在字幕提示中使用元数据被认为可以改善 AI 生成的文本，正如 GitHub 上的示例脚本 EveryDream2trainer’s caption_cog 所演示的那样。
Vast.AI 的安全性受到审查：关于 Vast.AI 的讨论集中在其缺乏对严格安全协议（如 HIPAA）的遵守。参与者建议对于敏感任务使用主流云服务商，因为 Vast.AI 的 SSH 容器设置存在固有的 root 访问风险。
突破免费 Colab 限制及澄清：澄清了 Colab 对 Web UI 的限制，指出仅免费版本不兼容。此外，还提到了一份详细介绍生成式音频视频文本世界模型的 Google 文档、关于 LLM 持续预训练的研究以及 Grok 开源仓库，但未详细说明具体的社区反应。关于 Nvidia 的 GPT-4 采用拥有 1.8 万亿参数的 MoE 架构的传闻也被讨论，但尚未确认其是否就是 GPT-4。

OpenAccess AI Collective (axolotl) Discord

Axolotl 推动 LLM 训练更进一步：工程师们讨论了 Axolotl，认为它是直接使用 transformers 代码进行模型微调的高效替代方案，支持使用 YAML 文件进行配置。目前人们对 ScatterMoE 优化 (ScatterMoE repo) 以及它如何与庞大的 Grok 模型权重相互作用表现出浓厚兴趣——尽管考虑到 Grok 宣称的体量，其性能表现平平，目前的关注点已转向潜在的 qLoRA FSDP 处理 (Grok GitHub)。
量化与下一代硬件引发关注：一场激烈的辩论强调了使用 AQML 进行极端模型压缩的应用 (AQML GitHub)。此外，传闻即将推出的 Nvidia RTX 5000 系列将带来 VRAM 和带宽增强，这可能会彻底改变 AI 训练 (TechPowerUp 文章)。
数据集困境与定制解决方案：LLM 用户遇到了 tokenizer 的小毛病以及由于路径指定错误导致的 HFValidationError。他们寻求关于构建自定义 completion 数据集的建议，并得到了使用 jsonl 文件的指导。此外，工程师们正在探索 NVIDIA NeMo-Curator（一个数据治理工具包 (NeMo-Curator GitHub)），同时正在评估 Mistral 等解决方案的模型合并潜力。
关于模型兼容性与性能的对话：该社区一直在解决配置问题，例如一位用户在指向本地数据集进行微调时遇到困难，同时发现了一个可能误导依赖 epoch 的验证过程的评估 bug。在模型开发中，兼容性是关键，这从探索合并具有统一训练格式的模型策略中可见一斑。
寻求基于 Adapter 的强化学习路径：有用户提出了关于使用不同的 LoRa adapter 在独立模型上进行 DPO（可微策略优化）的可行性问题，这表明了对更细致且针对特定模型的强化学习方法的探索。

CUDA MODE Discord

光子芯片开辟新路径：一段名为 “New Chip Breakthrough: x1000 faster” 的 YouTube 视频介绍了光子芯片，声称其性能提升了 1000 倍，并展示了 Lightmatter 在光子超级计算方面的进展。

Triton 攻克 CUDA 难题：发布了一套新的具有挑战性的 Triton Puzzles 以帮助用户磨练技能，并推出了一个用于 Triton 调试的可视化工具，以简化对复杂 load/store 函数的理解。

CUDA 社区追求优化：CUDA 频道的讨论深入涉及了 warp schedulers、active warps 和内存管理，表明了集体推动 CUDA 效率最大化的动力，并分享了关于项目结构以获得更好性能的见解。

机器学习硬件的新进展：康奈尔大学 Mohamed Abdelfattah 教授领导的研究小组因其在可重构计算和高效机器学习方面的工作而受到关注，并详细介绍了配套的硕士级课程 ECE 5545 (CS 5775)，该课程深入探讨了针对硬件系统的 ML 优化。

Ring Flash Attention 拨云见日：围绕 FlashAttention 和 RingAttention 等注意力机制的内存需求进行了广泛讨论，包括知识共享以及对 Striped Attention 在实现更好工作负载方面的进展（详见相关论文）。

MLSys 2024：机器学习与系统的交汇：对 5 月份举行的 MLSys 2024 会议充满热情，该会议专注于机器学习与系统的融合，倡导通过跨学科方法来突破 AI 效率的界限。

OpenRouter (Alex Atallah) Discord

Llama 模型提示词兼容性确认：一个简单的 “Yes!” 确认了 Llama 模型在与 OpenAI JavaScript 库交互时，可以使用包含 “system”、”user” 和 “assistant” 等键的 JSON 结构。
AI 聊天机器人充值技巧：用户讨论了聊天机器人模型的支付方式，建议在未绑定信用卡的情况下“充值余额（topup your balance）”。
Sonnet 在角色扮演中表现出色：Sonnet 被强调为角色扮演中最一致的 AI，通过避免重复和随机性，表现显著优于其他模型。
带有上下文的聊天：分享了有效构建提示词的最佳实践，包括通过在 user 或 assistant 消息中包含 system 上下文来对模型进行“越狱（jailbreaking）”。
将书籍拆解为提示词：提到使用脚本分析书籍片段时，lzlv 70B 能提供更好且更一致的提示词输出，超越了其他可能给出无关结果的模型。

LangChain AI Discord

在 astream_log 和 astream_events 之间明智选择：一名公会成员讨论了 astream_log 与 astream_events 的生命周期，担心 astream_events 仍处于 beta 阶段可能导致弃用。同时，宣布了一个利用 Claude 3 Opus 和 GPT-4 Turbo 等模型的先进研究助手和搜索引擎项目，为 Rubik’s AI 的 beta 测试人员提供两个月的免费高级访问权限。
LangChain 文档令新手困惑：针对 LangChain 文档的复杂性，像 namenot223_69478 这样的成员发现它对初学者来说很困难，因此建议在掌握基础知识后深入研究代码。目前正在征求具体反馈以优化文档体验。
RemoteRunnable 在 JavaScript 与 Python 中的差异：据报道，在 JavaScript 中使用 LangChain 的 RemoteRunnable 与 Python 相比结果不同，JavaScript 无法调用 /stream。尽管存在这一障碍，但尚未发现解决 JavaScript 流式传输问题的最新更新。
AI 爱好者发布聊天机器人和工具：公会讨论中涌现出一系列项目，例如名为 langchain-chatbot 的数据分析聊天机器人、用于管理书签的 Discord AI living-bookmarks、为健康和生产力数字顾问提供见解的邀请、名为 Scrapegraph-ai 的 AI Python 爬虫，以及名为 lyzr-automata 的销售和研究 AI。
值得关注的 AI 项目教程：Nutriheal 应用展示了 AI 与 Ollama 和 Pebblo 等工具结合的多功能性，如 15 分钟的 YouTube 演示 “Making an AI application in 15 minutes” 所示。同时，一篇名为 “Plan-and-Execute using Langgraph” 的 YouTube 教程详细介绍了如何构建计划与执行（plan-and-execute）风格的 Agent。

Interconnects (Nathan Lambert) Discord

Api-gate：揭秘泄露的 LLM 机密：研究人员透露，API 调用可能会暴露商业 LLM 的细节，利用 softmax bottleneck 来获取专有模型的见解。这些发现展示了估算 LLM hidden size 的可行方法，并再次引发了对 API 保护模型安全性的担忧。
十亿美元的问题：GPT-3.5 有多大？：一项研究估计 OpenAI 的 gpt-3.5-turbo 可能约为 7B 参数，引发了关于该数字准确性的辩论，特别是在 Mixture of Experts (MoE) 模型可能打破这种简单尺寸估算的背景下。
开源定义引发争议：Sebastian Raschka 发布的一篇帖子暗示机器学习领域即将出现争论，焦点集中在 OSS 社区标准和开源定义上，尤其是 Apache 2.0 与 GPLv3 许可证之间的对比。
巨兽 Grok-1 开源：在社区的惊叹声中，Grok-1 模型（一个 314B 参数的 MoE 模型）已在 Apache 2.0 协议下公开发布，引发了将其基准测试与其他模型（如 Falcon）进行对比的分析，以及对分发方式的讨论。
全球模型邮寄？：针对 Grok-1 非传统的模型分发方式，成员们开玩笑地讨论了通过物理硬盘邮寄模型权重与使用云服务的物流对比，反思了让大型模型广泛可用的挑战和成本。

Alignment Lab AI Discord

Aribus 的热情与困惑并存：一篇 Aribus 的 Twitter 帖子引发了关注和讨论，但成员们对其潜在应用也感到困惑。
寻找精通 HTTP 的 Embeddings：一场对话围绕寻找专门针对 HTTP 响应定制的 Embeddings 模型展开，以及 Transformer 模型是否能胜任这一利基角色。
征集定制微调的 Mistral：一份请求在流传，希望获得在特定数据集上进行微调的 Mistral 模型，包括 orca-math-word-problems-200k 和 nvidia/OpenMathInstruct-1。
Grok 1：耗资源的庞然大物：对话集中在训练和微调 Grok 1 所需的巨额资源要求，以及与 GPT-4 和 Claude 等领先模型相比，其高昂成本与性能产出之间的微妙界限。
MoE 训练效率创新高：有关于高效 MoE (Mixture of Experts) 训练基础设施的讨论，尽管受到计算资源可用性的限制。

LLM Perf Enthusiasts AI Discord

懒惰开发者的座右铭：一位公会成员引用 Devin 作为应用开发中极简主义方法的灵感，主张简单化，并对现有的开源选项在处理比具有文件系统控制的本地应用更复杂的任务时表示不满。
推特上的 Anthropic 指控：@tszzl 的一条推文引发了讨论，暗示 Anthropic 可能在扮演“受控反对派”的角色。成员们对这一争议性主张的动机和真实性进行了辩论。
对 KPU 与 GPT-4 对比的担忧：Maisa 宣布的 Knowledge Processing Unit (KPU) 引起了公会内部对其基准测试方法的怀疑，特别是将 KPU 增强的 GPT-4 与非 turbo 版本的 GPT-4 进行对比时。此外，还提出了实际应用中的延迟担忧。
解读 KPU 架构：关于 KPU 的功能和架构存在误解，一些人认为它包含创新的上下文窗口管理和自我评估技术。Maisa 的 CEO @davipar 在 Twitter 上澄清说，KPU 的作用类似于知识管理的 GPU，并提供了一个用于独立评估的 API key 和一个 notebook。
Claude Sonnet 的规模化：提到了对 Claude Sonnet 在大规模运行下的性能查询，特别是涉及高 Token 量的项目，表明了对高效、大规模 LLM 的需求。

DiscoResearch Discord

DiscoLM 遭遇德语语言障碍：DiscoLM-mixtral-8x7b-v2 模型在生成德语响应时表现挣扎，在序列分类微调期间也出现了类似问题并导致 ValueError。这一现象延伸到了其他德语语言模型，Reddit 上的反馈强调了性能对比，例如 SauerkrautLM Una SOLAR Instruct 与 Starling LM 7B Alpha 之间的比较 (Reddit 反馈)。
DiscoLM-70b 运行受阻：尝试使用 vllm 在本地运行 DiscoLM-70b 时遇到了问题，这表明尽管在资源丰富的机器上运行，仍可能存在兼容性问题。
领悟 Grok 的持久性：拥有 314B 参数的 Grok 模型在 GitHub 链接中被分享，讨论围绕运行该模型的实用性展开，考虑到它仅需要 300GB 内存。
德语语言模型基准测试：对话涵盖了对更好的德语语言模型基准测试的需求，引用了一篇可能具有影响力的论文，题为 supergleber-german-language-evaluation-benchmark，并暗示了与大学研究的合作，提及了维尔茨堡大学计算机学院 (Informatik Uni Würzburg)。
服务器迁移并非易事：将演示服务器从家庭环境迁移到专业设施的过程受到网络故障的困扰，希望能下周解决这些问题。相比之下，据说托管在家的机器遇到的问题更少，这为服务器可靠性争论增添了幽默色彩。

Datasette - LLM (@SimonW) Discord

Prompt Engineering 获得提升：Explosion 的 Prodigy 集成了用于 Prompt Engineering 的新工具，旨在为工程师简化流程。这些工具专注于将 Prompt Engineering 视为数据标注挑战，尽管实际应用可能会受到限制。
用于 Prompt 实验的开源工具和 SDK 辅助：工程师们讨论了各种用于 Prompt 测试的资源，如开源的 PromptTools 和 Vercel AI SDK，每种工具都提供不同的用户体验，但分别被指出在版本管理和模型响应对比便捷性方面存在不足。
Helicone AI 进入 Prompt 管理领域：Helicone AI 正在成为 Prompt 管理的潜在全方位解决方案，开始开发 Prompt 管理和分析工具，这些工具在处理复杂 AI 任务中可能起到关键作用。
探索基于多语言角色的内容翻译：一篇分享的博客文章详细介绍了一个利用 GPT-3.5-turbo 通过不同角色翻译内容的创新实验，为语言模型在内容创作中的灵活性提供了见解。
寻找 Seed：用户提出的一个查询涉及 OpenAI 模型在过去 API 请求中使用的 Seed 的可恢复性，表现出对模型输出的可复现性和随机性控制的兴趣。

Skunkworks AI Discord

新训练方法提升指日可待：baptistelqt 正在完成一篇关于新训练方法的论文，该方法增强了全局准确率和样本效率，VGG16 上的测试准确率在仅一个 epoch 内从 0.04 提高到 0.1 证明了这一点。由于资源限制，该方法在更大模型上的可扩展性目前尚未测试。
大模型困境遇到慷慨相助：baptistelqt 对在更大模型上测试其方法所需的计算能力的担忧得到了 far_el. 的回应，后者表达了兴趣并提议讨论资源分配。
合作开发“深思熟虑”的语言模型：satyum 对 “Quiet-STaR” 项目表现出兴趣，该项目提倡语言模型可以“三思而后行”的理念，欢迎在 PyTorch 和 Transformer 架构方面有资历的潜在合作者。
离题趣闻：成员们还分享了非技术内容，例如 pradeep1148 分享的一个 YouTube 视频，该视频对技术或工程讨论没有贡献。

[注：来自 #off-topic 频道的分享 YouTube 视频没有足够的上下文来评估其与技术讨论的相关性。]

第 2 部分：各频道详细摘要与链接

Stability.ai (Stable Diffusion) ▷ #announcements (1 条消息):

推出 Stable Video 3D：Stability.ai 发布了 Stable Video 3D (SV3D)，这是一款生成式模型，是早期 Stable Video Diffusion 的进阶版。SV3D 能从单张物体图像创建高质量的多视角图像，并能生成 3D 网格（meshes），超越了之前的模型如 Stable Zero123 和 Zero123-XL。了解更多
发布了 SV3D 的两个变体：此次发布引入了两个变体，SV3D_u 和 SV3D_p。SV3D_u 根据单张图像输入生成轨道视频，而 SV3D_p 扩展了这些功能，尽管消息在提供更多细节前被截断了。

提到的链接：推出 Stable Video 3D：从单张图像进行高质量的新视角合成与 3D 生成 — Stability AI：当我们发布 Stable Video Diffusion 时，我们强调了视频模型在各种应用中的多功能性。在此基础上，我们很高兴发布 Stable Video 3D。这是一款…

Stability.ai (Stable Diffusion) ▷ #general-chat (988 条消息🔥🔥🔥):

Stability AI 新闻与 SD3 期待：用户正焦急等待 SD3 邀请函的发放，并分享了对 4 月份可能发布的预测。讨论集中在包括 Stable Video 3D 公告在内的更新、之前的模型以及与区块链公司的合作伙伴关系，正如 stability.ai/news 所提到的。
SD 中的技术挑战与修复：用户讨论了运行不同版本 AI 模型的技术问题，提到了低效的代码、AVX 指令集等特定需求，以及对某些模型行为的不满。他们还分享了在消费级硬件上运行 Stable Cascade 和 SDXL 等模型的经验。
Pickle、PT 文件与 SAFETENSORS：用户寻求将 .pt 文件转换为 SAFETENSORS 的帮助。提到大多数 .pt 文件可以安全使用，并链接到了官方 Python 文档，警告与 Pickle（Python 中的一种对象序列化方法）相关的安全风险。
关于商业用途和开源许可的担忧：有一场关于各种模型相关许可的讨论，特别是商业使用权。一些用户对开源许可表示冷漠，暗示如果某样东西开源了，它就不再属于创作者。
生成 AI 艺术并在低端 PC 上运行：用户询问了如何使用 Stable Diffusion 执行特定任务，例如在不改变风格的情况下为线稿上色，以及如何在低 VRAM 的 PC 上运行 AI 模型。建议包括使用特定的 ControlNet 以及尝试像 Civitai 这样的云端生成服务。

提到的链接:

grok-1: Grok-1 是一个 314B 参数的 Mixture of Experts 模型 - Base model（未微调）- 8 个专家（2 个激活）- 86B 激活参数 - Apache 2.0 许可证 - 代码： - 祝编码愉快！另：我们正在招聘：
Avatar Cuddle GIF - Avatar Cuddle Hungry - Discover & Share GIFs: 点击查看 GIF
coqui/XTTS-v2 · Hugging Face: 未找到描述
PollyannaIn4D (Pollyanna): 未找到描述
Iron Man Mr Clean GIF - Iron Man Mr Clean Mop - Discover & Share GIFs: 点击查看 GIF
Introducing Stable Video 3D: Quality Novel View Synthesis and 3D Generation from Single Images — Stability AI: 当我们发布 Stable Video Diffusion 时，我们强调了视频模型在各种应用中的多功能性。在此基础上，我们很高兴发布 Stable Video 3D。这个新...
Yess GIF - Yess Yes - Discover & Share GIFs: 点击查看 GIF
NVLink | pny.com: 未找到描述
Stable Video Diffusion - SVD - img2vid-xt-1.1 | Stable Diffusion Checkpoint | Civitai: 查看我们的快速入门指南！ https://education.civitai.com/quickstart-guide-to-stable-video-diffusion/ 基础 img2vid 模型经过训练用于生成...
Reddit - Dive into anything: 未找到描述
The Complicator's Gloves: 优秀的软件在多个方面不断受到攻击。首先是那些业余爱好者，尽管只读完了《傻瓜编程》，却不知何故设法拿到了那份巨额合同...
pickle — Python object serialization: 源代码：Lib/pickle.py。pickle 模块实现了用于序列化和反序列化 Python 对象结构的二进制协议。“Pickling”是将 Python 对象层级结构转换为...的过程。
Page Not Found | pny.com: 未找到描述
WKUK - Anarchy [HD]: 最滑稽的经济无知。—— Murray Rothbard 的《自由、不平等、原始主义和分工》(http://mises.org/daily/3009)。—— Th...
Vancouver, Canada 1907 (New Version) in Color [VFX,60fps, Remastered] w/sound design added: 我对这段 1907 年加拿大温哥华的视频进行了上色、修复，并添加了天空视觉效果和音效设计。这段视频是从有轨电车上拍摄的，这些...
GitHub - DiffusionDalmation/pt_to_safetensors_converter_notebook: This is a notebook for converting Stable Diffusion embeddings from .pt to safetensors format.: 这是一个用于将 Stable Diffusion embeddings 从 .pt 转换为 safetensors 格式的 notebook。 - DiffusionDalmation/pt_to_safetensors_converter_notebook
Proteus-RunDiffusion - withoutclip | Stable Diffusion Checkpoint | Civitai: 介绍 Proteus-RunDiffusion。在开发 Proteus-RunDiffusion 的过程中，我们的团队开展了一个探索性项目，旨在提升...的能力。
Короткометражный мультфильм "Парк" (сделан нейросетями): 短篇动画《公园》——一部使用神经网络创作的极其引人入胜的短篇动画。
GitHub - Stability-AI/generative-models: Generative Models by Stability AI: Stability AI 的生成模型。通过在 GitHub 上创建账号来为 Stability-AI/generative-models 的开发做出贡献。
Install ComfyUI on Mac OS (M1, M2 or M3): 本视频是一个快速演示，展示如何在你的 M1, M2 或 M3 Mac 上本地安装 ComfyUI。了解更多关于 AI 动画的信息，并注册成为 AI ...
ajectory">GitHub - GraftingRayman/ComfyUI-Trajectory: 通过在 GitHub 上创建账号，为 GraftingRayman/ComfyUI-Trajectory 的开发做出贡献。
The Mushroom Motherboard: The Crazy Fungal Computers that Might Change Everything: 揭开真菌计算的秘密！探索真菌作为生物计算机的惊人潜力。从森林网络（wood-wide web）到非常规计算...
GitHub - mix1009/sdwebuiapi: Python API client for AUTOMATIC1111/stable-diffusion-webui: 适用于 AUTOMATIC1111/stable-diffusion-webui 的 Python API 客户端 - mix1009/sdwebuiapi
Home: Stable Diffusion web UI。通过在 GitHub 上创建账号，为 AUTOMATIC1111/stable-diffusion-webui 的开发做出贡献。
GitHub - chaojie/ComfyUI-DragAnything: 通过在 GitHub 上创建账号，为 chaojie/ComfyUI-DragAnything 的开发做出贡献。
Regional Prompter: Control image composition in Stable Diffusion - Stable Diffusion Art: 你知道可以为图像的不同区域指定提示词吗？你可以通过 Regional Prompter 扩展在 AUTOMATIC1111 上实现这一点。

提及的链接:

未找到标题：未找到描述
来自 Aravind Srinivas (@AravSrinivas) 的推文：是的，感谢 @elonmusk 和 xAI 团队开源了 Grok 的基础模型。我们将针对对话式搜索对其进行微调并优化推理，并将其提供给所有 Pro 用户！↘️ Quoti...
来自 Aravind Srinivas (@AravSrinivas) 的推文：我们已将 Perplexity Pro 用户在 Claude 3 Opus（当今市场上最好的 LLM）上的每日查询次数设为无限！尽情享受吧！
Apple 的 AI 雄心可能包括 Google 或 OpenAI：另一项重大的 Apple / Google 交易可能即将达成。
来自 Brivael (@BrivaelLp) 的推文：Zuck 刚刚对 Grok 的发布做出了反应，他并没有留下深刻印象。“3140 亿参数太多了。你需要一大堆 H100，而我已经把它们全买光了” 🤣
Shikimori Shikimoris Not Just Cute GIF - Shikimori Shikimoris Not Just Cute Shikimoris Not Just A Cutie Anime - 发现并分享 GIF：点击查看 GIF
Nothing Perplexity 优惠：在 Nothing，我们正在构建一个让科技再次变得有趣的世界。还记得每个新产品都让你兴奋不已的时光吗？我们正在带回那种感觉。
来自 Bloomberg Technology (@technology) 的推文：独家：Apple 正在洽谈将 Google 的 Gemini AI 引擎内置到 iPhone 中，这是一项潜在的重磅交易 https://trib.al/YMYJw2K
✂️ Sam Altman 谈 AI LLM 搜索：47 秒 · 由 Syntree 剪辑 · 原视频 "Sam Altman: OpenAI, GPT-5, Sora, Board Saga, Elon Musk, Ilya, Power & AGI | Lex Fridman Podcast #419" 作者 Le...
这些公司在隐藏什么？：关于 Rabbit R1 和 Humane Ai Pin 的想法。如果你想支持这个频道，可以考虑点击上面的“加入”按钮成为 Dave2D 会员！http://twit...
Rabbit Inc. 的 FCC ID 2BFB4R1 AI Companion：Rabbit Inc. 为 AI Companion 提交的 FCC ID 申请，FCC ID 为 2BFB4R1。已批准的频率、用户手册、照片和无线报告。

提到的链接：

pplx-api：未找到描述
pplx-api form：使用 Typeform 将数据收集转变为一种体验。创建精美的在线表单、调查、测验等等。免费试用。

Links mentioned:

Lightning AI | Turn ideas into AI, Lightning fast：AI 开发的一站式平台。协同编程、原型设计、训练、扩展、服务。直接在浏览器中运行，无需设置。由 PyTorch Lightning 的创作者打造。
Open Release of Grok-1：未找到描述
Cosmic keystrokes：未找到描述
Blog：未找到描述
xai-org/grok-1 · Hugging Face：未找到描述
🦅 EagleX 1.7T : Soaring past LLaMA 7B 2T in both English and Multi-lang evals (RWKV-v5)：一个 Linear Transformer 刚刚在英语和多语言评估中，以更少的训练 Token 跨越了 Transformer 模型的金标准 LLaMA 7B。这是历史性的首次。
Crystalcareai/GemMoE-Beta-1 · Hugging Face：未找到描述
Piper TTS Spanish - a Hugging Face Space by HirCoir：未找到描述
About xAI：未找到描述
Announcing Grok：未找到描述
Mixtral of Experts：我们推出了 Mixtral 8x7B，一种稀疏混合专家 (SMoE) 语言模型。Mixtral 采用了与 Mistral 7B 相同的架构，不同之处在于每一层由 8 个前馈块组成 (...
Qwen/Qwen1.5-72B · Hugging Face：未找到描述
Unsloth Fixing Gemma bugs：Unsloth 正在修复 Google 的开源语言模型 Gemma。
Introduction | AIKit：AIKit 是一个一站式平台，可快速开始托管、部署、构建和微调大语言模型 (LLMs)。
Google Colaboratory：未找到描述
damerajee/Llamoe-test · Hugging Face：未找到描述
CodeFusion: A Pre-trained Diffusion Model for Code Generation：想象一下，如果一个开发者只能修改最后一行代码，那么在函数写对之前，他需要从头开始写多少次？用于代码生成的自回归模型...
How to Fine-Tune an LLM Part 1: Preparing a Dataset for Instruction Tuning：学习如何在指令数据集上微调 LLM！我们将介绍如何格式化数据，并在这个（几乎）纯 PyTorch 的最小示例中训练 Llama2、Mistral 等模型。
ISLR Datasets — 👐OpenHands documentation：未找到描述
Tweet from Unsloth AI (@UnslothAI)：Unsloth 本周在 GitHub 上非常热门！🙌🦥 感谢大家和所有 ⭐️Stargazers 的支持！查看我们的仓库：http://github.com/unslothai/unsloth
Paper page - Simple linear attention language models balance the recall-throughput
- tradeoff: 未找到描述
- Sam Altman: OpenAI, GPT-5, Sora, 董事会风波, Elon Musk, Ilya, 权力与 AGI | Lex Fridman Podcast #419: Sam Altman 是 OpenAI 的 CEO，该公司是 GPT-4, ChatGPT, Sora 以及许多其他尖端 AI 技术的幕后推手。请通过...支持本播客。
- Mistral 微调入门（支持 16k, 32k, 128k+ 上下文）: 在我们最新的教程视频中，探索使用自有数据轻松微调语言模型 (LLMs) 的秘诀。我们深入探讨了一种高性价比且...
- argilla (Argilla): 未找到描述
- transformers/src/transformers/models/mixtral/modeling_mixtral.py at main · huggingface/transformers: 🤗 Transformers: 为 Pytorch, TensorFlow 和 JAX 提供的尖端机器学习库。 - huggingface/transformers
- teknium/GPT4-LLM-Cleaned · Datasets at Hugging Face: 未找到描述
- GitHub - mistralai/mistral-src: Mistral AI 7B v0.1 模型的参考实现。: Mistral AI 7B v0.1 模型的参考实现。 - mistralai/mistral-src
- GitHub - jiaweizzhao/GaLore: 通过在 GitHub 上创建账号，为 jiaweizzhao/GaLore 的开发做出贡献。
- GitHub - xai-org/grok-1: Grok 开源发布: Grok 开源发布。通过在 GitHub 上创建账号，为 xai-org/grok-1 的开发做出贡献。
- GitHub - AI4Bharat/OpenHands: 👐OpenHands : 让手语识别变得触手可及。: 👐OpenHands : 让手语识别变得触手可及。 | **注意：** 不再积极维护。如果您有兴趣接手并推进该项目，请提交 issue - AI4Bharat/OpenHands
- 安装 requirements 时出错 · Issue #6 · xai-org/grok-1: 我已经安装了 python 3.10 和 venv。尝试执行 "pip install -r requirements.txt" 时报错：ERROR: Ignored the following versions that require a different python version: 1.6.2 Requires-Python >=3...
- GitHub - unslothai/unsloth: 速度提升 2-5 倍，显存占用减少 70% 的 QLoRA & LoRA 微调: 速度提升 2-5 倍，显存占用减少 70% 的 QLoRA & LoRA 微调 - unslothai/unsloth
- Falcon 180B 开源语言模型性能超越 GPT-3.5 和 Llama 2: 开源语言模型 FalconLM 提供了比 Meta 的 LLaMA 更好的性能，并且可以用于商业用途。如果收入超过 100 万美元，商业使用需支付版税。
- FEAT / Optim: 由 younesbelkada 添加 GaLore 优化器 · Pull Request #29588 · huggingface/transformers: 这个 PR 做了什么？如标题所示，添加了来自 https://github.com/jiaweizzhao/GaLore 的 GaLore 优化器。修复了：#29512。这是我目前测试 API 的方式：import torch import datasets from ...
- 实现 Phi-2 支持的暂存 PR。由 cm2435 提交 · Pull Request #97 · unslothai/unsloth: ….org/main/getting-started/tutorials/05-layer-norm.html]
</div> --- **Unsloth AI (Daniel Han) ▷ #[announcements](https://discord.com/channels/1179035537009545276/1179039782681202829/1218580567453470860)** (1 条消息): - **Unsloth AI 沉浸在 GitHub 的明星光环中**: Unsloth AI 本周在 **GitHub 上热门 (trending)**，预示着一波支持浪潮，并呼吁用户为 [该项目点星 (star)](https://github.com/unslothai/unsloth)。该项目承诺在 QLoRA & LoRA 微调中实现 2-5 倍的速度提升和 70% 的显存节省。 ![Unsloth on GitHub](https://opengraph.githubassets.com/069510fd66d8abc1adacd2fb8fc1c4eee8c8d13d100decc1286f9497fb8f6e4c/unslothai/unsloth) **提到的链接**: GitHub - unslothai/unsloth: 速度提升 2-5 倍，显存占用减少 70% 的 QLoRA & LoRA 微调: 速度提升 2-5 倍，显存占用减少 70% 的 QLoRA & LoRA 微调 - unslothai/unsloth --- **Unsloth AI (Daniel Han) ▷ #[random](https://discord.com/channels/1179035537009545276/1179039861576056922/1218112720994308122)** (25 条消息🔥): - **偶然的用户名邂逅**：一位成员分享了他们曾考虑使用 **TSAR bomba** 作为昵称的经历，有趣的是这与另一位用户的用户名巧合，引发了关于此类巧合的讨论。 - **数字时代的童心直觉**：讨论了儿童如何因缺乏内心杂念而擅长吸收信息，而不像成年人那样容易被数字设备分心。 - **拥抱诗意创意**：一位用户分享了一首名为 **"An Appeal to A Monkey"** 的诗，呼吁在现代复杂的世界中向猴子的简单与活力学习。 - **AI 模型微调对话**：关于 **Mistral-7b** 与 **Gemma 7b** 在特定领域分类任务中的优劣和性能的对话，包括 Bug 修复的更新以及模型的相对强度。 - **资源分享与探索**：用户分享了各种项目的链接，例如 **"Mixtral branch" 的 GitHub pull request**、**共享地图上 Pokemon RL agents 的可视化**，以及 Uiverse.io 上的**开源 UI 元素**。
提及的链接：
- Pokemon Red Map RL Visualizer：未找到描述
- 4205 UI elements: CSS & Tailwind：未找到描述
- [WIP] add support for mixtral by tohrnii · Pull Request #145 · unslothai/unsloth：Mixtral 开发中（WIP）
--- **Unsloth AI (Daniel Han) ▷ #[help](https://discord.com/channels/1179035537009545276/1179777624986357780/1218104575022727230)** (568 条消息🔥🔥🔥): - **训练复杂性与评估 Mistral**：一位成员尝试了 [Mistral-7B Instruct v0.2](https://huggingface.co/unsloth/mistral-7b-instruct-v0.2-bnb-4bit) 等模型，并遇到了 Huggingface Inference API 无法工作的问题。另一位成员建议确保在推理时采用 4-bit 量化，并澄清了使用 Unsloth 的 Colab Notebook 和 `eval_steps` 参数的过程。 - **GGUF 转换的 Unsloth 参数**：一位成员讨论了将 Gemma 模型转换为 GGUF 时遇到的问题，并收到了在 Notebook 提供的单元格之外执行特定 Python 转换命令的建议。 - **保存与转换问题**：一位尝试使用 Gemma 模型运行 ChatML Notebook 的用户在保存过程中遇到了错误。他们得到了关于在 Kaggle 或本地环境中手动运行转换的替代命令的帮助。 - **关于全量微调（Full Fine-Tuning）支持的讨论**：用户询问了 Unsloth 进行全量微调的能力，目前已知其在 LoRA 和 QLoRA 方面表现出色。Unsloth 团队解释说，虽然未来可能会支持全量微调，但这目前不是 Unsloth 的重点，且需要手动修改代码库。 - **部署与微调查询**：讨论还包括使用 Unsloth 部署模型的指南，重点是那些属于开源领域的模型（如 Mistral），而非像 OpenAI 的 GPT-4 这样的专有模型。此外，还澄清了 `eval_steps` 对微调结果的影响，确认它仅决定评估频率，而不影响最终的微调性能。
提及的链接：
- ybelkada/Mixtral-8x7B-Instruct-v0.1-bnb-4bit · Hugging Face: 未找到描述
- Google Colaboratory: 未找到描述
- Kaggle Mistral 7b Unsloth notebook: 使用 Kaggle Notebooks 探索并运行机器学习代码 | 使用来自“无附加数据源”的数据
- TinyLlama/TinyLlama-1.1B-Chat-v1.0 · Hugging Face: 未找到描述
- Hugging Face – 构建未来的 AI 社区。: 未找到描述
- Google Colaboratory: 未找到描述
- DPO Trainer: 未找到描述
- unsloth/mistral-7b-instruct-v0.2-bnb-4bit · Hugging Face: 未找到描述
- Home: 速度快 2-5 倍，显存占用减少 70%，支持 QLoRA & LoRA 微调 - unslothai/unsloth
- Home: 速度快 2-5 倍，显存占用减少 70%，支持 QLoRA & LoRA 微调 - unslothai/unsloth
- Home: 速度快 2-5 倍，显存占用减少 70%，支持 QLoRA & LoRA 微调 - unslothai/unsloth
- qlora/qlora.py at main · artidoro/qlora: QLoRA: 量化 LLMs 的高效微调。通过在 GitHub 上创建账号来为 artidoro/qlora 的开发做出贡献。
- Home: 速度快 2-5 倍，显存占用减少 70%，支持 QLoRA & LoRA 微调 - unslothai/unsloth
- Generation - GPT4All Documentation: 未找到描述
- Home: 速度快 2-5 倍，显存占用减少 70%，支持 QLoRA & LoRA 微调 - unslothai/unsloth
- Google Colaboratory: 未找到描述
- Unsloth: Merging 4bit and LoRA weights to 16bit...Unsloth: Will use up to 5.34 - Pastebin.com: Pastebin.com 自 2002 年以来一直是排名第一的粘贴工具。Pastebin 是一个可以在线存储文本并设置存储期限的网站。
- GitHub - unslothai/unsloth: 2-5X faster 70% less memory QLoRA & LoRA finetuning: 速度快 2-5 倍，显存占用减少 70%，支持 QLoRA & LoRA 微调 - unslothai/unsloth
- GitHub - vllm-project/vllm: A high-throughput and memory-efficient inference and serving engine for LLMs: 一个高吞吐量且显存高效的 LLMs 推理和服务引擎 - vllm-project/vllm
- Does DPOTrainer loss mask the prompts? · Issue #1041 · huggingface/trl: 嗨，有个小问题，DataCollatorForCompletionOnlyLM 会通过对提示词进行损失掩码处理来仅针对回答进行训练。DPOTrainer (DPODataCollatorWithPadding) 也是这样工作的吗？
- Supervised Fine-tuning Trainer: 未找到描述
- Trainer: 未找到描述
- Reproducing of Lora Model Result on MT-Bench · Issue #45 · huggingface/alignment-handbook: 最近，我尝试在自己的数据集上拟合 DPO。最初，我尝试复现你们 LoRA 模型的结果（MT-Bench 上的 7.43）。然而，我遇到了一些问题。尽管使用了你们所有的...
- llama.cpp/examples/server/README.md at master · ggerganov/llama.cpp: 使用 C/C++ 进行 LLM 推理。通过在 GitHub 上创建账号来为 ggerganov/llama.cpp 的开发做出贡献。
- GitHub - abetlen/llama-cpp-python: Python bindings for llama.cpp: llama.cpp 的 Python 绑定。通过在 GitHub 上创建账号来为 abetlen/llama-cpp-python 的开发做出贡献。
- HuggingFaceH4/zephyr-7b-alpha · 添加聊天模板：未找到描述
- HuggingFaceH4/zephyr-7b-alpha · Hugging Face：未找到描述
- unsloth/unsloth/chat_templates.py (main 分支) · unslothai/unsloth：速度提升 2-5 倍，显存占用减少 70% 的 QLoRA 和 LoRA 微调 - unslothai/unsloth
--- **Unsloth AI (Daniel Han) ▷ #[suggestions](https://discord.com/channels/1179035537009545276/1180144489214509097/1218239216975351928)** (21 条消息🔥): - **AI 速读**：一篇论文引起了成员们的注意，并被认为是“另一篇了不起的论文”，将被添加到阅读清单中。 - **微调 Epochs 辩论**：**Yahir9023** 和 **Flail_** 讨论了模型训练的最佳 Epochs；虽然 Yahir9023 考虑为语音神经网络增加更多 Epochs，但 Flail_ 建议对于 LLM，通常“3 个 Epochs 是标准”。 - **LLM 的学习与风格**：Flail_ 提到，微调 LLM 往往对其风格的影响大于对其知识的影响，并警告说**更多的 Epochs 可能会导致 LLM 对特定数据产生过拟合（overfit）**。 - **知识规模匹配**：**Flail_** 建议可训练参数的数量应与数据量匹配，对于 800,000 行数据，建议 Rank 为 **32 或 64**。 - **轻量级 AI 模型展示**：**Yahir9023** 分享了更小模型的链接，如 **Tiny Mistral**，这些模型可以集成到 Unsloth Repo 中，但社区反应不一。
提到的链接：
- Dans-DiscountModels/TinyMistral-v2.5-MiniPile-Guidelines-E1 · Hugging Face：未找到描述
- M4-ai/TinyMistral-6x248M-Instruct (main 分支)：未找到描述
--- **LM Studio ▷ #[💬-general](https://discord.com/channels/1110598183144399058/1110598183144399061/1218098224586293319)** (301 条消息🔥🔥): - **在本地硬件上探索模型性能**：成员们讨论了在具有特定硬件配置（如配备 18GB 内存的 M3 Pro）的本地机器上运行哪些模型。各种模型建议包括用于编程的 CodeLlama、DeepSeek，以及用于其他任务的 TinyDolphin 和 WizardVicuna。 - **使用 LM Studio 的故障排除和技巧**：一些用户遇到了验证文件完整性循环和多 GPU 设置的问题，而其他用户分享了技巧，例如在使用 Docker 部署 Web UI 时使用本地 IP 地址而不是 localhost。 - **关于本地模型功能的查询**：一位成员询问 LM Studio 是否支持视频换脸或读取文件夹中的文件等功能。共识是 LM Studio 目前不支持这些功能，并推荐了替代方案。 - **关于模型能力和硬件要求的讨论**：用户对不同显卡的能力进行了广泛讨论，其中 Tesla K40 和 K80 是值得注意的提及。针对使用不同 GPU 配置运行 34GB LLM 等大型模型的查询得到了解答，强调了对大量 VRAM 的需求。 - **关于开源大模型实用性的辩论**：一个名为 Grok 的 316B 参数模型的开源引发了关于其本地使用实用性的辩论，鉴于其庞大的体积。一些用户对在典型硬件设置上运行此类大型模型的能力表示怀疑。
提到的链接：
- grok-1: Grok-1 是一个 314B 参数的 Mixture of Experts 模型 - Base model (未 finetuned) - 8 个专家 (2 个激活) - 86B 激活参数 - Apache 2.0 许可证 - 代码： - Happy coding! p.s. 我们正在招聘：
- Ratha GIF - Ratha - 发现并分享 GIF: 点击查看 GIF
- xai-org/grok-1 · 314B params has 297G file size ?: 未找到描述
- <a href="https://github.com/continuedev/continue/issues/713"">Issues · continuedev/continue</a>: ⏩ 使用任何 LLM 进行编码的最简单方法——Continue 是一个适用于 VS Code 和 JetBrains 的开源 autopilot - Issues · continuedev/continue
- [1hr Talk] Intro to Large Language Models: 这是一个面向普通观众的 1 小时 Large Language Models 介绍：它是 ChatGPT, Claude 和 Bard 等系统背后的核心技术组件。什么是...
- Mistral: Easiest Way to Fine-Tune on Custom Data: 本视频由 Gradient.ai 赞助，点击此处查看：https://gradient.1stcollab.com/engineerprompt 在本视频中，我们将学习如何对 Mistral 进行 fine-tune...
--- **LM Studio ▷ #[🤖-models-discussion-chat](https://discord.com/channels/1110598183144399058/1111649100518133842/1218119135423234058)** (138 条消息🔥🔥): ```html
- Command-R 模型等待合并至 LM Studio: 一位成员提到，LM Studio 对 Command-R 35B 模型的支持即将推出，目前正等待 llama.cpp pull request #6033 的合并以及 LM Studio 的更新。一旦合并，CohereAI/Command-R 应该可以正常工作。
- 寻求本地使用的模型推荐: 多位成员讨论了根据个人系统限制寻找合适的本地运行模型。此类咨询的一个富有成效的来源包括访问 reddit 的 LocalLLaMA 社区以获取见解。
- Yi-9B-200K 是一个新的 Base Model: 澄清了 Yi-9B-200K 具有 200k 上下文限制，并且源自一个新的 Base model 系列，与 Llama 模型不同。更多详细信息可以在其 Hugging Face model card 上找到。
- Grok-1 发布引发辩论: 关于 xAI 发布 Grok-1 模型的讨论显示，人们对其在没有进一步 tuning 的情况下的即时效用持怀疑态度。Grok-1 是一个 314B 参数的 Mixture-of-Experts 模型，未针对任何特定任务进行 fine-tuned。关于 Grok-1 Base model 发布的详细信息可以在 xAI blog 上阅读，模型的原始权重在 Apache 2.0 许可证下共享。
- 在有限的硬件上运行 LLM: 成员们交流了在显存受限的 GPU（如具有 6GB VRAM 的 Nvidia 1660 Super）上运行语言模型的建议。其中一个建议包括运行较小的模型如 Gemma 2b，这通常需要操作上的妥协或硬件调整。
```
提及的链接:
- Open Release of Grok-1: 未找到描述
- MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training: 在这项工作中，我们讨论了构建高性能多模态大语言模型 (MLLMs) 的方法。特别是，我们研究了各种架构组件和数据选择的重要性。通过仔细的...
- 01-ai/Yi-34B · Prompt template?: 未找到描述
- Reddit - Dive into anything: 未找到描述
- What are Parameters in Large Language Model?: 什么是大语言模型中的参数？ 00:26 💡 像 GPT-3 这样的大语言模型中的参数是在训练过程中学习到的变量，用于最小化...
- 01-ai/Yi-9B-200K · Hugging Face: 未找到描述
- [1hr Talk] Intro to Large Language Models: 这是一个面向普通观众的 1 小时大语言模型入门介绍：它是 ChatGPT、Claude 和 Bard 等系统背后的核心技术组件。什么是...
- Add Command-R Model by acanis · Pull Request #6033 · ggerganov/llama.cpp: 关于 Command-R 35B 模型（128k 上下文）的信息可以在以下网址找到：https://huggingface.co/CohereForAI/c4ai-command-r-v01。基于 llama2 模型并进行了一些更改：新的超参数...
--- **LM Studio ▷ #[🧠-feedback](https://discord.com/channels/1110598183144399058/1113937247520170084/1218213037060657273)** (12 messages🔥): - **Command-R 35B 兼容性问题**：一位成员关于 Command-R 35B v1.0 模型与 llama.cpp 兼容性的说法被纠正，指出 *llama.cpp 尚不支持 c4ai*。尽管由于文件列表显示“为 Cohere 的 Command-R 模型添加了 llama.cpp GGUF”而产生了困惑，但[该问题尚未解决](https://huggingface.co/andrewcanis/c4ai-command-r-v01-GGUF)。 - **Linux AMD 用户也需要关注**：一位成员建议 **Linux 版本下载页面**应注明 AMD 用户需要 OpenCL 驱动程序才能在程序中使用 GPU，这对于用户引导是一个虽小但有帮助的改进。 - **LM Studio 的插件支持问题**：有人询问 **LM Studio** 是否允许用户与自己的文档聊天或添加类似 autogen 的插件。一位成员澄清说确实支持插件，并建议开启服务器模式以这种方式进行连接。 **提到的链接**：andrewcanis/c4ai-command-r-v01-GGUF · Hugging Face: 未找到描述 --- **LM Studio ▷ #[🎛-hardware-discussion](https://discord.com/channels/1110598183144399058/1153759714082033735/1218129474348912711)** (480 messages🔥🔥🔥): - **GPU 梦想与预算现实**：成员们讨论了在不同 GPU 上运行本地语言模型 (LMs) 的差异，包括对 Tesla **K80** 与现代显卡性能的推测。虽然有人建议购买二手 **3090**，但低廉价格的诱惑使一些人转向购买 K80，尽管存在潜在的限制和散热挑战。 - **基准测试的烦恼**：社区讨论了在不同硬件配置下寻找全面 **LM 基准测试**数据的困难。有人提议建立一个中心化资源或利用 LM Studio 进行标准化基准测试，并强调了来自他人个人配置的性能结果差异巨大。 - **史诗般的 Epyc 冒险**：随后是对构建多 GPU 配置的详细探讨，成员们讨论了 AMD **Ryzen** 与 **Epyc** CPU 在支持多个 NVLinked GPU 方面的优缺点。为了获得更好的 PCIe 通道支持而转向 **Epyc** 的高昂成本和性能回报是一个核心关注点，这表明在本地运行大型模型需要巨大的投入。 - **MacBook 也参与其中**：与自定义配置的讨论形成对比，一些人对使用高性能 **MacBook** 机型运行 LMs 表示满意。MacBook 的易用性、便携性和性能提供了一个更简单但更昂贵的自定义配置替代方案。 - **过去的采购与未来的计划**：成员们分享了从 eBay 采购二手 Tesla 等组件的计划，讨论了 **Epyc CPU** 安装的细节以及对扭矩螺丝刀的需求。在技术讨论之余，大家还分享了关于组装梦想中的 LM 运行机器的趣闻轶事和革命友谊，包括其中的起起落落。
提到的链接：
- 未找到标题: 未找到描述
- 👾 LM Studio - 发现并运行本地 LLMs: 查找、下载并实验本地 LLMs
- LM Studio Beta 版本发布: 未找到描述
- 带有双 Edge TPU 的 M.2 加速器 | Coral: 使用 M.2 (E key) 接口将两个 Edge TPUs 集成到旧系统和新系统中。
- 未找到标题: 未找到描述
- 404 页面: 未找到描述
- 未找到标题: 未找到描述
- 华擎 (Asrock Rack) ROMED8-2T ATX 服务器主板 AMD EPYC 7003 (搭载 AMD 3D V-Cache 技术)/7002 系列处理器 SP3 (LGA 4094) 双 10GbE - Newegg.com: 购买华擎 ROMED8-2T 服务器主板，支持 AMD EPYC 7003 (搭载 AMD 3D V-Cache 技术)/7002 系列处理器 SP3 (LGA 4094) 双 10GbE，享受快速发货和顶级客户服务。一旦您...
- 141.5SG$ |Epyc 7282 16 核心 32 线程 16x2.8Ghz 120W Socket SP3 CPU 9 纳米 Epyc 7282| | - AliExpress: 更明智的购物，更美好的生活！Aliexpress.com
- 戴尔 (Dell) T710 塔式服务器双 6 核 X5650 **144Gb RAM** 240gb SSD +6X 600G SFF SAS | eBay: 未找到描述
- Intel Core i5-3470 规格: Ivy Bridge, 4 核心, 4 线程, 3.2 GHz, 77 W
- 新款 /Wave ®AI 服务器 NF5688M6 NVIDIA HGX TESLA A800 80G 八路 GPU 服务器/期货 | eBay: 未找到描述
- AMD EPYC 7232P CPU 处理器 8 核心 3.10GHz 32MB 缓存 120W - 100-000000081 | eBay: 未找到描述
- AMD EPYC 7F72 CPU 处理器 24 核心 3.20GHz 192MB 缓存 240W - 100-000000141 | eBay: 未找到描述
- 戴尔 (Dell) T710 塔式服务器双 6 核 X5670 **24 核心** 64GB RAM | eBay: 未找到描述
- Nvidia Tesla K80 24GB GPU GDDR5 PCI-E GPU 加速器 12 个月保修 | eBay: 未找到描述
- AMD EPYC 7232P 8 核心 3.1GHz 32MB L3 处理器 - Socket SP3 - 100-000000081 | eBay: 未找到描述
- p_sortType=bestmatch_sort">Luckim 官方旗舰店 - AliExpress 上的惊喜产品与独家折扣：未找到描述
- Nvidia Tesla K80 24GB GPU GDDR5 PCI-E GPU 加速器 12 个月保修 | eBay：未找到描述
- 搜索 Thingiverse - Thingiverse：下载文件并使用您的 3D 打印机、激光切割机或 CNC 进行构建。
- Micro Center - 计算机与电子产品：Micro Center - 计算机与电子产品 - 数千种可供购买的产品：台式机、笔记本电脑、显示器、DIY 电脑零件、升级、数字成像、打印耗材、便携式设备、音频设备...

**发布与深潜：拐点 + 稳定篇** *(注：“Shipping” 在科技语境中指发布产品或功能，“Dipping” 通常指深入探讨或研究。)*