争论之下,Linux 之父 Linus 出面回应、核心开发者愤而辞职选择从此视而不见听而不闻...
近日一系列曝光的邮件和法庭文件将 Meta 推到了风口浪尖
Ubuntu 在系统升级、Snaps 包管理等方面有着不少问题
为了深入剖析 DeepSeek 带来的技术突破、市场震荡以及更深远的行业影响,两位资深专家展开了一场五小时的深度对话。
大模型走进程序员的日常之际,你都会用它来做些什么?它的能力是否达到你的预期?本篇文章中,GitHub 资深工程师将分享他在实际工作中对这些工具的真实应用场景,也希望这些经验能够带给你一些启发。
谷歌取消一系列多元化招聘目标 | 极客头条
领航国产大模型新征程
苹果新专利:挥动iPhone即可执行操作 | 极客头条
为了方便调试,我们不仅需要知道发生了什么异常,我们还需要知道异常是怎么发生的。
苹果开源Swift Build|极客头条
推荐
资讯
热榜
自荐
动态
有红包
杨强院士领衔,2025 全球机器学习技术大会正式官宣!
AI的未来,正在加速到来!
30 赞
踩
为什么全球TOP科技公司都要求开发者精通C++?
“C++是编程世界的屠龙刀——但大多数人,从未真正拔出过它。”在高性能计算、操作系统、游戏引擎、嵌入式系统、金融科技等领域,C++ 始终是企业级开发的首选语言。无论是 Google、Microsoft,还是 Tesla、Meta、NVIDIA,全球顶级科技公司都在招聘要求中明确指出:精通 C++!C++ 的强大不仅在于极致的性能,它的底层控制力、工程化能力、现代化演进让它成为开发者必须掌握的硬核...
10 赞
有道子曰推理模型“子曰-o1”发布即开源,14B小参数复现OpenAI o1强推理效果
伴随着推理模型的赛道持续扩大,网易有道在教育垂直领域内的深耕沉淀,也将赋能其在教育垂类模型的深入探索,以子曰-o1为起点,持续释放推理模型在教育领域内的应用价值。作为14B轻量级单模型,子曰-o1支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。这其中,可供应用的开源模型却不多,且参数规模较大,无法在低显存的消费级显卡上运行,即使是采用了低比特量化技术,使其能够在单卡上部署,但相应也为长思维链的运行带来了不稳定性。
23 赞
2024 京东零售技术年度总结
我们选取了 2024 年零售技术 11 项有代表性的技术成果,与大家分享。
勿再浮沙筑高台,侯捷C++系列精品课都有哪些亮点?
本次上线的系列课程集结了《STL 标准库与泛型编程》、《C++ 新标准 11/14》、《C++ 面向对象开发》、《C++ 内存管理机制》精华课程,全面覆盖 C++ 核心技术,帮助开发者从基础到深入,逐步掌握现代 C++ 编程精髓。权威讲师亲授:两岸知名 C++ 技术大师侯捷老师亲授;难点全覆盖:涵盖 C++ 新特性、STL 标准库、内存管理及面向对象设计等关键主题;150+ 线上精品视频:超过百节精心制作的在线教学视频;纸质版专属讲义:课程附带专业编制的纸质版讲义,系统梳理知识点,方便查阅与标记;
9 赞
突破Transformer架构,MiniMax 01首次开源,海外开发者再一次被中国模型震惊了
2025开年,MiniMax 又上新了。继公布全模态模型家族后,时隔5个月,MiniMax再亮相两大模型,且模型权重完全开源。而且与GPT-4o和Claude-3.5-Sonnet性能平起平坐,尤其在上下文窗口方面表现出色,处理能力甚至达到其他顶尖模型的 20 - 32倍。更重要的是,这两款全新模型扩展了新型Lightning Attention架构,突破了传统Transformer架构,同时也是线性注意力机制的首次大规模实现。什么概念?
25 赞
π₀:基于VLM的多任务具身操作基础模型
π₀是基于一种新颖的流匹配架构,该架构建立在预训练的视觉语言模型(VLM)之上。这种方法使模型能够继承互联网规模的语义知识,并有效地执行复杂和高度灵活的机器人控制任务。模型利用预训练的VLM主干,利用从大规模数据中获得的广泛知识、语义推理和问题解决能力。该架构采用流匹配(diffusion的一种变体),以表示复杂的连续动作分布。这使得模型能够生成高频率的动作块(高达50 Hz),适用于灵巧的操作任务。
29 赞
AI半导体技术、市场与未来
过去两年,英伟达崛起是科技领域的一个经典案例。通过CUDA系统,他们创建了一个使用GPU进行机器学习的开发者生态系统;通过Mellanox,他们成为了数据中心网络的领导者。然后,他们将所有硬件集成到服务器中,提供垂直集成的算力一体机。凭借这一系列组合性技术优势,英伟达在“AI淘金热”中提供的铲子占据行业核心地位,这导致它成为有史以来最成功的公司之一。随之而来的是,不少挑战者入局以求从英伟达主导的市...
32 赞
“慢”增长时代的企业数据体系建设:超越数据中台
随着互联网的发展,宏观经济环境和行业竞争环境发生了巨大变化,互联网企业对内部数据体系的需求也发生了很大变化。本文将从相对宏观的角度,分享关于互联网企业数据体系建设如何变革的一些思考和总结。
24 赞
只改一行代码,在第四代至强® 可扩展平台上高效微调优化 ChatGLM-6B
开源预训练大模型 ChatGLM-6B 通过以下三个方面可实现基于第四代英特尔® 至强® 可扩展处理器的高效微调优化:一是借助英特尔® 高级矩阵扩展,大幅提升模型微调计算速度;二是结合英特尔® MPI 库充分利用处理器架构特点和多核配置,发挥 CPU 的整体效率;三是利用英特尔® 至强® CPU Max 系列处理器集成的 HBM 满足大模型微调所需的大内存带宽。
14 赞
释放数字金融向新力 奇富科技金融AI大模型成果落地上海金融科技国际论坛特展周活动
今年9月,上海市发布《上海高质量推进全球金融科技中心建设行动方案》,作为设立在上海的金融科技企业,奇富科技将持续加大在AI大模型技术上的研发与投入,利用其在数据处理、自然语言理解、决策优化等方面的强大能力,深入挖掘AI技术在金融业务的潜在价值,推动国产金融大模型技术迭代升级,为上海金融科技发展贡献力量,助力中国数字金融的高质量发展。同时,上海金融科技产业联盟创新监管实验室与奇富科技现场达成创新伙伴合作,双方将共同探索金融科技创新的路径,推动新技术在金融领域高效、安全的应用,助力上海全球金融科技中心建设。
19 赞
50张图,直观理解混合专家(MoE)大模型
Mixtral 8x7B的高效训练与推理效果曾引发AI社区对混合专家(MoE)模型的广泛关注,后来居上的国产开源大模型DeepSeek以及腾讯近期开源的Hunyuan-Large(基于Transformer的最大MoE模型)也选择了MoE框架路线。为何大语言模型总是离不开MoE的身影?借助50多个图例,数据科学家Maarten Grootendorst由浅入深多维度剖析了MoE模型,从基础概念出...
曝百度和吉利为极越员工缴纳11月社保,内部开始转账;英伟达辟谣对中国断供;曝iPhone17改用条形横置摄像头设计 | 极客头条
极客头条」—— 技术人员的新闻圈!CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理 | 苏宓出品 | CSDN(ID:CSDNnews)
15 赞
商业化大前端在性能优化领域的探索与实践
页面性能是直接影响用户体验,当页面加载时间过长、交互操作不流畅时,意味着业务可能会出现转化率降低、用户流失等业务问题。本文详细介绍了快手商业化技术部针对页面性能所做的治理工作。
33 赞
京东电商搜索:大模型生成式检索优化实践
详细介绍了基于大模型的生成式检索,从 Lexical based 方向深入探究大模型生成式检索的应用,从 SemanticID based 方向深入探究大模型生成式检索的应用。
22 赞
LLM后训练绝招:1%预训练成本,实现最高20倍算力扩展效果
根据规模定律,扩大训练计算规模可以提高大型语言模型(LLM)性能的关键,但调研机构Epoch AI的研究,LLM再训练无需高额费用,也能让AI能力获得显著提升。在该研究中,他们引入了一个基本框架,用于量化后训练增强的收益和成本,特别是通过计算等效增益来衡量收益。他们将该框架应用于一系列具有代表性的后训练增强,并发现性能提升非常显著,但微调成本通常与预训练成本相比非常小,某些后训练增强技术可以在不到...
企业生成式AI最新调查:AI支出激增6倍,多模型部署盛行
企业AI格局正在迅速重塑。随着实验项目逐步落地投入生产,海外风险投资机构Menlo Ventures最新发布的《2024年企业生成式AI现状》报告对600名企业IT决策者展开了调研,深入分析了这场变革中正在浮现的新赢家与失利者。(本文由OneFlow编译发布,转载请联系授权。原文:https://menlovc.com/2024-the-state-of-generative-ai-in-the...
LLM逻辑推演策略选择:推理时计算 vs 训练时计算
AGI实现的一大标志是,具备人类级别的逻辑推理(reasoning)能力。近期,随着推理(inference)模型GPT o1、DeepSeek R1-Lite的发布,模型的逻辑推理能力得到显著提升,也预示着对LLM潜力的深度挖掘正在转向推理阶段。围绕增强LLM逻辑推理能力这一目标,美国人工智能与密码学研究实验室Bagel团队结合最新研究,从算术、常识和符号这三种主要逻辑推理类型出发,对比了在推理...
11
1月
16
19
31
3月
VIP
C++新标准11/14
Java8编程实战
面试之排序算法
实用数据分析:数据分析师从小白到精通
快速带你入门深度学习与实战
python从0到1:期货量化交易系统(CTP实战,高频及合成K线数据
全球产品经理技术大会
高端 IT 人员出国意愿调查问卷
Qualcomm 开发者专区
英特尔开发人员专区
英特尔开发套件专区
移动AI云电脑重磅发布,引领智能终端新纪元
BSV区块链中文开发者社区
ConsenSys Web3社区
程序员都在用的中文IT技术交流社区
专业的中文 IT 技术社区,与千万技术人共成长
关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!