fcten

fcten

V2EX member #7940, joined on 2011-04-13 23:42:32 +08:00
Today's activity rank 8979
Per fcten's settings, the topics list is hidden
Deals info, including closed deals, is not hidden
fcten's recent replies
4 days ago
Replied to a topic by jindeq 程序员 还是选择开通了 Z.ai 的年度 MAX 套餐
@jindeq 这两天确实卡,但是还能用。5.1 刚发布的那一周卡得没法用
H20 整机大概 200 万,可以部署几乎所有的顶级开源模型了(如果不是全部的话)。这些钱如果用来采购 claude 的 api ,大概也就够十来个人的部门烧 2 个月。

实在要省钱,RTX PRO 6000 也行,整机估计 100 万吧。AMD AI Halo 这种消费级产品也就个人玩玩,公司还是算了吧。
5 days ago
Replied to a topic by xiaxichen 程序员 这 GLM 的 token plan 根本买不到啊
之前 v 站一位老哥推荐智谱国际站的时候上车了,PRO 年付 200 刀,已经用了两个月了。
上班用公司的 opus 4.6 ,家里用 GLM 5.1 ,感觉我的使用场景下确实没有明显的差距,唯一的痛点就是 20 万上下文不够用经常任务到一半触发上下文压缩。这次 5.2 支持了 1M 上下文应该会好很多。
5 days ago
Replied to a topic by zs1607212422 MacBook Pro MAC 购买建议(求支招)
PyCharm 非常吃内存,项目里稍微有几个 demo 数据集就卡... M4/M5 Air 如果是 16G 版本的应该是不够用的

不过纯远程开发应该是可以的(项目在服务器上,本地什么都不存)
8 days ago
Replied to a topic by mingtdlb Local LLM GPU 跑 LLM 也会超频吗?
不知道你这个图的背景是啥,但超频潜力大不等于会超频使用,数据中心基本不可能会去超频。对于数据中心来说超频带来的收益相比额外电费、散热成本和稳定性风险来说是非常不划算的。不像消费显卡挂了最多就是这局游戏废了。计算卡挂一次可能会浪费整个集群几千个 GPU Hours 。
1. 人太多。能招到便宜的年轻人为什么要用 35+的老登?虽然出生人口开始下降了,但高考人数还是历史高点,这几年大学毕业生还是很多。
2. 说的好听点叫竞争充分,说的难听点叫太卷。公司赚不到钱就要想办法扣人力成本。
17 days ago
Replied to a topic by followadc Local LLM mac 64g 能部署哪个本地大模型
目前比较好的应该是 qwen3.6-35b-a3b 或 qwen3.6-27b
高峰期我 PRO 套餐都不敢用...
因为不觉得有人会用...为什么放着 deepseek 官方的 api 不用用百炼的 api 啊?成本得高几十倍吧...
百炼的前缀缓存做的稀烂,价格还巨贵。百万上下文的 agent 场景怕是得用破产。
May 26
Replied to a topic by Satoshl 投资 真有人能在大 A 挣到钱吗?
今年挣了 30%了

确实大部分人都是亏的,简单的说没买半导体相关的基本都是亏的
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2575 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 15:24 · PVG 23:24 · LAX 08:24 · JFK 11:24
♥ Do have faith in what you're doing.