mythabc

mythabc

V2EX 第 165026 号会员,加入于 2016-03-27 12:40:20 +08:00
今日活跃度排名 4419
根据 mythabc 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
mythabc 最近回复了
10 小时 54 分钟前
回复了 calyiw 创建的主题 生活 你们想要爱情吗,达到什么程度?
想要,和想要共产主义乌托邦一样想要。
击掌(〃 ̄︶ ̄)人( ̄︶ ̄〃)
27 天前
回复了 narip 创建的主题 职场话题 28 岁转码建议?
别做开发,做算法。趁现在 llm 的风头还在,理论物理在这方面完全等同于科班。
积极拥抱变化寻找出路,不要再钻研代码细节。
(上回发了个 cursor 的帖子,还有人说我广告,时代都变了感觉 v2 有一帮冥顽不灵的人)
32 天前
回复了 mythabc 创建的主题 程序员 cursor 为什么没有带火 [带鱼屏]
@sunny352787 来张图
没中奖。。。
73 天前
回复了 mrjnamei 创建的主题 职场话题 裁员了,裁员了,裁员了
接裁神
81 天前
回复了 fid 创建的主题 Local LLM 8x4090 离线部署 Qwen2.5 求助
1. 为什么单张可用 60%? 把其他任务都集中到 4 张显卡上,剩余 4 张用于跑 72b-awq 。多卡不建议超过 4 张,因为通信成本。
2. vllm 支持量化模型的。生产上用的最多的就是 vllm ,然后是 sglang (但是个人体感 sglang 比 vllm 稳定一些,因为版本都在不断迭代,所以仅是时效性的使用感受)。ollama 基于 llama.cpp ,这个项目最初就是用于在资源有限环境把模型 offload 到内存里跑起来的,一般就是个人玩具使用。
3. 喜欢一键的话,可以试一下 xinference ,有 docker 镜像,挺好用。
4. web 方案其实是各种 web client + openai style api ,各个推理引擎以 openai style api 将接口提供出来,兼容各类应用。
89 天前
回复了 yilon 创建的主题 职场话题 技术和业务需求哪个牛逼?
懂业务的技术和懂技术的业务牛逼。
@yousikicn macbook 的传统是一个模具用三代,可以找到部分媒体的“风声”,m4 是最后一代刘海屏了。刘海屏是真的丑,也没塞什么传感器。

(不能下代换个灵动岛把...
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2831 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 9ms · UTC 07:28 · PVG 15:28 · LAX 23:28 · JFK 02:28
Developed with CodeLauncher
♥ Do have faith in what you're doing.