openmynet 最近的时间轴更新
openmynet

openmynet

V2EX 第 183627 号会员,加入于 2016-07-25 17:52:18 +08:00
今日活跃度排名 6962
openmynet 最近回复了
1 天前
回复了 tanszhe 创建的主题 程序员 这个算法有多难? 把 Ai 也难到了
你这应该找的是聚类这方面的算法,比如 dbscan 之类的,好一点的可以试试基于 infomap 的聚类,或者 louvain 、Leiden
AI,看起来更像知识的诅咒,你知道的越多就知道的越少。
16 天前
回复了 internelp 创建的主题 问与答 AI 训练时中文是否比英文更具优势?
ds-r1 是以 ds-v3 为底经过强化学习后的推理模型。但 r1 在 mmlu-pro 上的评分要好于 v3 版本,这意味其实很多模型其实是有足够的知识储备,但缺乏对知识的理解与运用。r1 展示了模型经过强化学习后的模型对知识的抽象能力,类似于 alphaGo 。
这些抽象能力足够让 r1 能够理解成语典故等知识,这意味的可以模型可以使用更少的词汇理解更多的知识,使模型不再局限于人类约定的分词语义而由模型重新定义了分词。即分词语义被模型重新定义成为理解知识一种符号。常规的分词模型其分词数量是对于模型来说否合理很难界定。理想的状态是大语言模型可以自己确定分词的数量和分词的方式。

前段时间就有一篇 meta 的论文 Byte Latent Transformers https://arxiv.org/pdf/2412.09871 正在尝试解决类似的问题,从这方面看,我觉得 中文 确实要不 英文 更具优势。
看《泰坦之旅》 是不是
从使用 ai 辅助开发角度我会推荐 rn ,AI 对 js/ts 的支持要比 dart 好太多。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2421 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 15:58 · PVG 23:58 · LAX 07:58 · JFK 10:58
Developed with CodeLauncher
♥ Do have faith in what you're doing.