CSDN - 专业开发者社区

头条

: 马斯克亲自下场招程序员：不认文凭，代码写得好就行！; 特斯拉CEO、社交媒体平台X背后的老板埃隆·马斯克亲自发了一条招聘启事，广纳“硬核软件工程师”，不看学历、不看背景，只要技术过硬、代码写得好就有机会入职X。

面壁发布 MiniCPM-o 2.6

这次是在端上，不用联网，仅 8B 参数

Win10寿命倒计时9个月！微软：届时也不支持Office应用

2025 年 10 月 14 日之后，将不再支持 Windows 10 设备的 Microsoft 365 应用。

可部署于所有设备上的开源加速Stable-Diffusion.cpp：让 AI 图像生成更快、更高效！

Sdcpp 是 Stable Diffusion 模型的 C/C++ 实现

Linux 6.13惊险一幕：微软代码改动引发混乱，英特尔和AMD紧急修复

这些代码极有可能会破坏某些系统上的 Linux 6.13。

上线百天用户破千万！Vidu 2.0 要让人人都成为新海诚

Vidu 是动漫生成领域的强者，没有之一。

热点

OpenAI计划几周内推出o3 mini推理模型

荣耀 CEO 赵明辞职｜极客头条

Nvidia发布微服务以保护AI代理

Cursor完成1.05亿美元B轮融资 | AI 头条

支付宝凌晨回应bug事故：不会向用户追款

IT就业市场连续第二年下滑 | 极客头条

阶跃星辰推理模型 Step R-mini 上线

一分钟速览AI新闻点！

突破Transformer架构，MiniMax 01首次开源，海外开发者再一次被中国模型震惊了

2025开年，MiniMax 又上新了

推荐
资讯
热榜
自荐
动态
有红包
排行榜

突破Transformer架构，MiniMax 01首次开源，海外开发者再一次被中国模型震惊了

2025开年，MiniMax 又上新了。继公布全模态模型家族后，时隔5个月，MiniMax再亮相两大模型，且模型权重完全开源。而且与GPT-4o和Claude-3.5-Sonnet性能平起平坐，尤其在上下文窗口方面表现出色，处理能力甚至达到其他顶尖模型的 20 - 32倍。更重要的是，这两款全新模型扩展了新型Lightning Attention架构，突破了传统Transformer架构，同时也是线性注意力机制的首次大规模实现。什么概念？

23 赞

踩

作者：CSDN资讯

π₀：基于VLM的多任务具身操作基础模型

π₀是基于一种新颖的流匹配架构，该架构建立在预训练的视觉语言模型（VLM）之上。这种方法使模型能够继承互联网规模的语义知识，并有效地执行复杂和高度灵活的机器人控制任务。模型利用预训练的VLM主干，利用从大规模数据中获得的广泛知识、语义推理和问题解决能力。该架构采用流匹配（diffusion的一种变体），以表示复杂的连续动作分布。这使得模型能够生成高频率的动作块（高达50 Hz），适用于灵巧的操作任务。

27 赞

踩

作者：Flying Youth

AI半导体技术、市场与未来

过去两年，英伟达崛起是科技领域的一个经典案例。通过CUDA系统，他们创建了一个使用GPU进行机器学习的开发者生态系统；通过Mellanox，他们成为了数据中心网络的领导者。然后，他们将所有硬件集成到服务器中，提供垂直集成的算力一体机。凭借这一系列组合性技术优势，英伟达在“AI淘金热”中提供的铲子占据行业核心地位，这导致它成为有史以来最成功的公司之一。随之而来的是，不少挑战者入局以求从英伟达主导的市...

28 赞

踩

作者：OneFlow_Official

“慢”增长时代的企业数据体系建设：超越数据中台

随着互联网的发展，宏观经济环境和行业竞争环境发生了巨大变化，互联网企业对内部数据体系的需求也发生了很大变化。本文将从相对宏观的角度，分享关于互联网企业数据体系建设如何变革的一些思考和总结。

23 赞

踩

作者：京东零售技术

只改一行代码，在第四代至强® 可扩展平台上高效微调优化 ChatGLM-6B

开源预训练大模型 ChatGLM-6B 通过以下三个方面可实现基于第四代英特尔® 至强® 可扩展处理器的高效微调优化：一是借助英特尔® 高级矩阵扩展，大幅提升模型微调计算速度；二是结合英特尔® MPI 库充分利用处理器架构特点和多核配置，发挥 CPU 的整体效率；三是利用英特尔® 至强® CPU Max 系列处理器集成的 HBM 满足大模型微调所需的大内存带宽。

14 赞

踩

作者：英特尔开发人员专区

释放数字金融向新力奇富科技金融AI大模型成果落地上海金融科技国际论坛特展周活动

今年9月，上海市发布《上海高质量推进全球金融科技中心建设行动方案》，作为设立在上海的金融科技企业，奇富科技将持续加大在AI大模型技术上的研发与投入，利用其在数据处理、自然语言理解、决策优化等方面的强大能力，深入挖掘AI技术在金融业务的潜在价值，推动国产金融大模型技术迭代升级，为上海金融科技发展贡献力量，助力中国数字金融的高质量发展。同时，上海金融科技产业联盟创新监管实验室与奇富科技现场达成创新伙伴合作，双方将共同探索金融科技创新的路径，推动新技术在金融领域高效、安全的应用，助力上海全球金融科技中心建设。

19 赞

踩

作者：CSDN资讯

50张图，直观理解混合专家（MoE）大模型

Mixtral 8x7B的高效训练与推理效果曾引发AI社区对混合专家（MoE）模型的广泛关注，后来居上的国产开源大模型De‍epSeek以及腾讯近期开源的Hunyuan-Large（基于Transformer的最大MoE模型）也选择了MoE框架路线。为何大语言模型总是离不开MoE的身影？借助50多个图例，数据科学家Maarten Grootendorst由浅入深多维度剖析了MoE模型，从基础概念出...

26 赞

踩

作者：OneFlow_Official

曝百度和吉利为极越员工缴纳11月社保，内部开始转账；英伟达辟谣对中国断供；曝iPhone17改用条形横置摄像头设计 | 极客头条

极客头条」—— 技术人员的新闻圈！CSDN 的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理 | 苏宓出品 | CSDN（ID：CSDNnews）

15 赞

踩

作者：极客日报

商业化大前端在性能优化领域的探索与实践

页面性能是直接影响用户体验，当页面加载时间过长、交互操作不流畅时，意味着业务可能会出现转化率降低、用户流失等业务问题。本文详细介绍了快手商业化技术部针对页面性能所做的治理工作。

31 赞

踩

作者：快手技术

京东电商搜索：大模型生成式检索优化实践

详细介绍了基于大模型的生成式检索，从 Lexical based 方向深入探究大模型生成式检索的应用，从 SemanticID based 方向深入探究大模型生成式检索的应用。

20 赞

踩

作者：京东零售技术

LLM后训练绝招：1%预训练成本，实现最高20倍算力扩展效果

根据规模定律，扩大训练计算规模可以提高大型语言模型（LLM）性能的关键，但调研机构Epoch AI的研究，LLM再训练无需高额费用，也能让AI能力获得显著提升。在该研究中，他们引入了一个基本框架，用于量化后训练增强的收益和成本，特别是通过计算等效增益来衡量收益。他们将该框架应用于一系列具有代表性的后训练增强，并发现性能提升非常显著，但微调成本通常与预训练成本相比非常小，某些后训练增强技术可以在不到...

23 赞

踩

作者：OneFlow_Official

企业生成式AI最新调查：AI支出激增6倍，多模型部署盛行

企业AI格局正在迅速重塑。随着实验项目逐步落地投入生产，海外风险投资机构‍Menlo Ventures最新发布的《2024年企业生成式AI现状》报告对600名企业IT决策者展开了调研，深入分析了这场变革中正在浮现的新赢家与失利者。（本文由OneFlow编译发布，转载请联系授权。原文：https://menlovc.com/2024-the-state-of-generative-ai-in-the...

22 赞

踩

作者：OneFlow_Official

LLM逻辑推演策略选择：推理时计算 vs 训练时计算

AGI实现的一大标志是，具备人类级别的逻辑推理（reasoning）能力。近期，随着推理（inference）模型GPT o1、DeepSeek R1-Lite的发布，模型的逻辑推理能力得到显著提升，也预示着对LLM潜力的深度挖掘正在转向推理阶段。围绕增强LLM逻辑推理能力这一目标，美国人工智能与密码学研究实验室Bagel团队结合最新研究，从算术、常识和符号这三种主要逻辑推理类型出发，对比了在推理...

15 赞

踩

作者：OneFlow_Official

尊享五大权益，2024 全球 C++ 及系统软件技术大会云会员上线！

全球数字化进程加速的当下，系统级软件作为数字世界的底层支柱，正在迎来前所未有的重要性与发展机遇。C++ 自 1985 年由 Bjarne Stroustrup 博士在贝尔实验室发明以来，一直被誉为系统级编程“皇冠上的明珠”。为了让更多技术爱好者紧跟行业最前沿，「2024 全球 C++ 及系统软件技术大会」特别推出「云会员」服务，让用户通过线上平台尽享全球顶尖技术盛宴。

5 赞

踩

作者：CSDN资讯

业内首款！联想百应智能体以AI彻底颠覆IT运维模式

11月28日，联想集团高级副总裁、中国方案服务业务群总经理戴炜出席“WISE2024 商业之王”大会，正式发布业内首款面向中小企业的IT服务智能体——联想百应智能体。其基于擎天智能IT引擎（擎天3.0），具备多模态交互、可视化思维链、多方案博弈、多智能体协作、全链路安全五大技术能力，首推AI 营销、AI 办公、AI 服务三大AI应用，助力中小企业开源、增效、降本。“AI浪潮下，智能IT是中小企业奔赴 AI 的最佳入口。”戴炜在现场表示。

9 赞

踩

作者：CSDN资讯

【70%以上程序员，不懂数据结构和算法！】

讲算法的人很多，但真正能讲透彻的很少，前京东开发工程师，现自媒体作者，全网拥有60W粉丝的《漫画算法》系列图书作者小灰，通过虚拟的主人公小灰的心路历程，用漫画的形式讲述了算法和数据结构的基础知识、复杂多变的算法面试题目及算法的实际应用场景。对于算法教学有着丰富的经验的小灰，将多年积累的算法知识通过生动形象的教学方式，让你听了就懂，轻松应对大厂的算法笔试题及相关面试！

5 赞

踩

作者：CSDN 程序人生

官宣：Cloudberry Database 正式加入 Apache 孵化器

Cloudberry 由 Greenplum Database 原始开发者创建，是一款领先且成熟的开源大规模并行处理（Massively Parallel Processing，MPP）数据库。它基于开源版的 Pivotal Greenplum Database® 衍生而来，但采用了更新的 PostgreSQL 内核，并具备更先进的企业级功能。Cloudberry 可以作为数据仓库使用，也可用于大规模分析和 AI/ML 工作负载。

30 赞

踩

作者：CSDN资讯