V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  anubu  ›  全部回复第 10 页 / 共 33 页
回复总数  658
1 ... 6  7  8  9  10  11  12  13  14  15 ... 33  
2024 年 1 月 4 日
回复了 sixlione 创建的主题 程序员 请问各位 V 友,现在哪个部署本地的 LLM 比较好?
这个硬件配置无法满足训练,不加硬件的话只能勉强跑推理,需要附加自有知识就套一个 RAG 的前台。显存太小了,跑起来很勉强,需要仔细调一调向量模型和大语言模型,尽量维持显存不爆。
如果就是想部署起来玩一玩的场景,不仅仅是 requirements.txt ,其它的 package.json 、pom.xml 就算好点也有限,在 Dockerfile 面前都要低头。容器部署对于爱折腾部署的人就是福音,再也看不到玩具 A 和玩具 B 打起来逼你选边站的场景了,成年人主打一个全都要。
@yinft 不好意思,没有特别的资料。可以简单的按照官方文档拉一个容器看看,基本的监控应该都有的,更详细可能要看官方文档了。
2024 年 1 月 3 日
回复了 Triump 创建的主题 程序员 实现一个企业内部知识库的问答机器人
前台项目主要有 FastGPT 和 langchain-chatchat ,基本都能开箱即用。FastGPT 完成度更高一些,但商业考量也多一些。进一步调优可能还是要看底层框架,langchain 、llama-index 等。有能力的话自己拿框架搓一个前台也可以。

模型还是看算力看规模,知识库类的一般要求不高。企业内部可能要自部署模型,chatglm3 、千问都可以,千问似乎更好一些。

关键词:RAG

真正落地能用还是要了解 RAG 应用的基本架构,各个流程节点也有很多优化措施值得摸索。
netdata 应该能满足要求。
https://github.com/netdata/netdata
2023 年 12 月 29 日
回复了 iorilu 创建的主题 程序员 怎么感觉 v2 这里很少有 ai 或大模型开发相关得讨论啊
国内玩的话应该会接触到魔搭、autodl ,差不多就是 huggingface 、colab 一类,集成度比较低但能用。
模型和平台个人开发者应该没太多机会,都是比较重的方向。搞一些工具或应用,比如 RAG 、可控生成,似乎还有点意思。比如 langchian-chatchat 、fastgpt ,有能力也可以搞一搞应用框架一类。
目前的商业化落地比较困难,LLM 生态都是看着挺有意思,要做到能投产却很困难。有大量的开源项目,不怎么费力就可以跑个七七八八,但要做到融合到生产业务里就很困难了。基于 langchain 、llama-index 等框架,糊一个勉强能落地的应用,能从政企跟风项目层层外包中捞点汤喝已是不错的结果。
2023 年 12 月 23 日
回复了 YVAN7123 创建的主题 职场话题 下班后喜欢做什么来放松自己?
躺沙发在电视上刷 B 站视频,上网冲浪,摆弄玩具。

晚上十点半到家意思是你喜欢下班后通过加班来放松自己吗。。。
2023 年 12 月 23 日
回复了 hbhh479q 创建的主题 汽车 车方向盘上那些按钮都是用来干啥的
其实还挺有用的,右边是多媒体控制一类的,播放、暂停、上一曲、下一曲、音量、确认、返回等,主要就是听音乐、接电话用的多一些。左边是自适应巡航相关的,买车 2 年,没上过高速没用过。上高速前学了一下,还是挺好用的。不同车可能不一样,不过应该大差不差。

买车前千挑万选,价格、功能、用料、做工一通对比。买车后,啥都不是,能跑就行。
2023 年 12 月 23 日
回复了 stonesirsir 创建的主题 生活 水龙头的位置离热水器太远,放热水要放很久
分两种情况:
第一种,心疼水费的。不要心疼,任何一种优化措施都比直接放掉更费钱。实在觉得浪费资源就拿盆接着冲厕所用。
第二种,不是心疼水费,就是想优化用户体验。要加钱,有效果,但很难说完美。

优化方案上面回答的有,基本也分两种:
第一种,全屋零冷水。基本逻辑就是不停循环,保证热水管一直有热水。优势是可以做到全屋各个用水点零冷水,劣势是这套系统要钱,已经装修完改造要钱,不停加热浪费能源也要钱。
第二种,小厨宝。基本逻辑就是在水龙头附近放一个热得快和储水箱。优势是设备成本、改造成本比较低,劣势是零冷水是单点的,不是全屋都有的。功率比较大,有安全隐患。

电热水龙头没研究过,净水有即热水龙头。不过自来水的流量比净水大多了,即热应该很难有效果。

一般来说,不是住别墅的,还是直接放水实在。
2023 年 12 月 20 日
回复了 106npo 创建的主题 生活 另一个角度:证明等额本金利息更高
“等额本息(20 年)每月还款额比等额本金(30 年)首月还款额还低,而且利息更是低了 25%.”

你是说你发现了租房子,租 2 个月比租 3 个月总价更低吗?不管你贷了 200 万还是 300 万,把你的房贷当做一个物品,利息当做租金。你租一个物品 20 年和 30 年的租金能一样吗?

金融搞复杂一点还是有用的,绕来绕去简单的常识都能把一部分人绕进去。
2023 年 12 月 20 日
回复了 Cola98 创建的主题 Kubernetes 大佬们,请教一个 k8s 可靠性问题
到目前的讨论似乎有点混乱,需要准确定义一下“容器部署”,是 kind 这种整个集群在容器中的情况还是 kubeadm 集群组件使用 static pod 的情况。
kubeadm 是官方支持的部署方案,稳定性肯定没问题的。二进制部署有点过于 old school 的感觉,我个人没有用过,不认为能提供额外的稳定性,并且维护复杂。

另外,虚拟机上使用 kubeadm 标准部署,并没有特别的套娃。公有云应该是类似的结构,甚至托管的控制平面都是虚拟的。kind 类似方案有点套娃,但用于开发测试环境没有什么问题。
2023 年 12 月 19 日
回复了 phytry 创建的主题 深圳 有车之后体会到深圳停车难的问题了
停车非常影响生活体验,该花钱花钱,算算一年多少钱,就当在游戏里氪金了。
@eephee 使用 kubeadm 部署的标准 k8s 集群,稳定性没有遇到特别大的问题,可能是规模比较小,稳定性要求也不高。使用 local pv 的话最好使用独立的磁盘,避免存储空间不足导致 Pod 调度异常。尽量避免在 k8s 集群上部署维护有状态应用集群,sts 集群在节点故障时处理起来很烦人。

大部分回复基于理想情况,最佳实践来评价这样做的坏处,的确没有错,说的风险也的确都存在。但实际做项目部署往往一言难尽,用户可能规模很小,或者只是初步的试用意向。如果要 k8s 集群 3master3worker ,MySQL 单机 1 台,minio 单机 1 台,Redis 单机 1 台等等,随随便便就小十台服务器是很难和人谈的。用户甚至希望服务器配置高一些,数量少一些都能接受。所以一个很自然的需求就是同一台高配服务器即部署基础组件,又能当做 k8s 工作节点。这个时候用 k8s 统一资源管理,也是一个选择。
几乎一样的场景,给客户部署的就是 MySQL 、mongodb 、redis 、minio 都部署在 k8s 集群中。尽量使用 helm 而不是 operator ,存储使用 local pv ,配合 node selector 强制绑定。
肯定不是最佳实践,但还要看具体场景。小规模客户,没有太多资源,在主应用必须部署到 k8s 的情况下,把其它组件拉到集群部署也是一种选择。本身也不是追求高可用、弹性调度,只是借助 k8s 部署和管理。实际上,客户规模够大,有能力的话,也不会同意这样的方案,直接把基础组件甩给客户基础设施团队是最好的。
还是有一些应用场景的,不过一般情况下更倾向通用的技术,这个场景下 devcontainer 、docker/docker-compose 是很好的解决方案。容器虽然臃肿一些,但隔离度很好,特别适合维护多个项目多种版本的情况。
2023 年 12 月 16 日
回复了 noclin 创建的主题 分享创造 开源可重现的 Homelab for DevOps,全站 HTTPS - homeinfra.org
感谢分享。
可重现似乎还是用 gitops 那一套好一些,不过 docker 生态里没有太好的实践,据说 portainer 有一个 gitops 工作流,还没有用过。k8s 生态的 gitops 实践相对多一些,不过复杂度又高了一些。注重可重现、IaC 的话,homelab 场景 k3s+gitops 感觉是个不错的选择。
容器工具更倾向 nerdctl+containerd ,虽然现阶段 docker 的 UI/UX 还是有一定优势的,但总有一些小地方让你想折腾一下的时候很难受,比如还是不支持第三方 registry 的 mirror ,要用 ghcr 一类的 registry 就不得不在 daemon 上挂代理,或者本地网络有透明网关整体解决网络问题。
2023 年 12 月 12 日
回复了 dream4ever 创建的主题 问与答 阿里云免费 SSL 证书有哪些替代方案?
- 阿里云免费次数不用担心。免费证书一年期不好找,3 个月的随便一个 acme 客户端都可以签,比如#1 推荐的。
- 一般签发证书不考虑国内国外问题,即常规业务场景一般不用考虑证书的影响。除非有老旧设备证书链兼容、ocsp 优化等场景,可以自行研究。

云厂商免费证书的最大优势是一年期,没有了一年期自己搞 acme 好了,愿意的话还可以在生产环境配置自动签发,完全免运维了。
2023 年 12 月 11 日
回复了 suuuch 创建的主题 Kubernetes 自建低成本集群(k8s, Spark)的方式有哪些?
家用场景不太考虑冗余高可用,多节点不是必须的。单节点跑 k8s 或 k3s 都是可行的,k8s 生态里的东西都能玩。

当然,如果是要练习或折腾着玩,多节点要求也不高,虚拟机、小主机、退役的手机、平板都可以加到集群里折腾。

如果不是特别需要练手裸金属场景,不建议入手多个低性能硬件,更建议入手单个高性能硬件。
1 ... 6  7  8  9  10  11  12  13  14  15 ... 33  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2692 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 41ms · UTC 07:58 · PVG 15:58 · LAX 00:58 · JFK 03:58
♥ Do have faith in what you're doing.