V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  lavande  ›  全部回复第 8 页 / 共 10 页
回复总数  197
1  2  3  4  5  6  7  8  9  10  
赞成2L
另外想问lz为啥男程序员coding时候不听歌?
不太清楚为什么要这样做……识别率怎么样也比不过用户自己啊,我看到一个词瞬间就知道我认不认识,然后要是不认识:在电脑上直接划线取词,在纸质文本上用手机摄像头+ocr取词,立刻就查到了,觉得很流畅啊,为啥要先过滤出生词来?
2015 年 6 月 9 日
回复了 wilsoncao 创建的主题 macOS 在 mac 正确使用 word 的姿态
libre office writer不错哇,我的论文全程用的这玩意儿,最后导出pdf去打印,完工!
2015 年 6 月 6 日
回复了 TOTOP 创建的主题 奇思妙想 大家是否自己每天处于过度阅读中?
@samael 虽然没找到图中的选项,不过我直接把朋友圈这个功能给停用了,就是说“发现”那一栏点出来没有朋友圈这一项了哈哈哈,感觉不错!
2015 年 6 月 5 日
回复了 cacoo 创建的主题 奇思妙想 作品不再是被创作,而是被发现
不过想想这个工作,给人工来做反而更高效。
一个有趣的经验就是,“读书破万卷,下笔如有神”
其实你的大脑里有个模型,在读书时候在不知觉地训练,最后当你输出时发现这个模型已经被训练得很厉害了,写出了好文章。
只是我们不太清楚大脑究竟是怎么工作的……
2015 年 6 月 5 日
回复了 cacoo 创建的主题 奇思妙想 作品不再是被创作,而是被发现
@cacoo 我估计作为“个体户”,搞出3000字的小说是非常困难的,因为没有那个计算能力,除非能找到超级计算机给你用……
另外就是lz的三个步骤我觉得不是太合理,1和2其实是可以合并的,因为1生成出来的东西可以说99%甚至更多是垃圾数据,不如在每一次生成时就套用一次2中的规则,符合则储存,不符合直接丢弃,不然太浪费储存。所以说到底其实就是利用规则直接穷举文本,而这个穷举出来的每个文本都应该是人类可读的,所以这个规则(模型)要非常非常强大,这就得有很大的语料库让你来训练模型了吧……建立这个语料库估计是个苦差事

我们来做点“小”工程吧,比如缩小到“国内独立民谣音乐人歌曲的歌词”,说一下我的做法:
1、收集国内独立民谣音乐人的名单,然后收集每个人的所有作品的歌词;
2、将这些歌词处理,建成语料库;
3、分析语料,构建(找)一个合理的语言模型;
4、训练这个语言模型;
5、用这个模型穷举可能的歌词作品(最后可能发现最好给个主题限制,不要穷举比较好);
6、人工判断是否可用,或后续修改和润色,完成。
2015 年 6 月 5 日
回复了 cacoo 创建的主题 奇思妙想 作品不再是被创作,而是被发现
其实我对这个挺感兴趣的,还是引用一下名言吧:
"Talk is cheap. Show me the code/demo"
2015 年 6 月 3 日
回复了 cacoo 创建的主题 奇思妙想 作品不再是被创作,而是被发现
不管是把创作描述成被创造还是被发现,这都无所谓
实际上lz要做的东西很简单,就是“机器辅助创作”

举个例子,类似苹果的garage band,稍作改动:
首先,我分析一下大多数摇滚歌曲的和弦走向,基于统计学(隐马尔可夫什么的)做出一个模型;
然后,为用户生成一套符合规律的和弦走向;
最后,用户用这套走向继续创作歌曲。

当然,这个是非常简单的了,我还可以用同样的方法做下列的东西:和弦的具体演奏方法(节奏型),节奏,主旋律,配器(乐器种类和编配套路),歌词等等……
最后用户做的就是,让机器先生成,听听看好听不,好听就留下,不好听再来,或者觉得凑合,自己再手动改改。

这是这个东西我是认为需要机器做一半人再做一半的,机器(或者说模型)还没有强大到可以生成一个“成品”且不需要任何人工改动就很让人满意,所以很难直接“生成+挑选”的模式,最多是计算机生成一个半成品,或者适当时候给个“启发”,然后让人去完成最后的成品工作。

从信息论的角度来考虑,从最早的不确定组合,到最后的确定的作品,这里需要用以解决不确定性的信息熵总归是那么多,就是看你从哪弄来这些信息。
2015 年 6 月 2 日
回复了 cacoo 创建的主题 奇思妙想 作品不再是被创作,而是被发现
穷举没有意义的
如果真要分析,都是基于统计学做的,要模型,要训练,需要大量有效的语料
2015 年 5 月 30 日
回复了 imNull 创建的主题 Linux linux server 怎么 bt 下载
@lovefree13 就是deluge和amule都可以作为daemon跑在后台的,你只要在自己电脑上运行一个GUI就可以控制它们了
另外,如ls大家所说,bt下载容易被服务商封号
2015 年 5 月 30 日
回复了 Roboo 创建的主题 SSD SSD 出来三年多了 你们用坏了几块?坏的时候是数据全丢?
多年前一直觉得很贵,没关注,直到有朋友跟我说时代不同了
一查,我槽便宜了好多,于是前天刚买了一块plextor的
这玩意儿很容易坏么?
2015 年 5 月 30 日
回复了 imNull 创建的主题 Linux linux server 怎么 bt 下载
deluged, amuled
PS 坐等被封号
2015 年 5 月 25 日
回复了 TOTOP 创建的主题 奇思妙想 大家是否自己每天处于过度阅读中?
请问如何把朋友圈关掉,同时不影响微信收发信息?
以前想做个人餐饮定制……比如定制好一周的菜谱,按时送饭菜上门,或者按时送菜原材料上门,或者直接派厨师上门……
2015 年 5 月 15 日
回复了 zaishanfeng 创建的主题 程序员 对于国人的开源项目,你敢用吗?
开源协议没有规定作者要对用户负责吧?
我一般都会看到without any warranty或者use at your own risk的字样
如果你说道德,用道德律人,我个人不太赞成
2015 年 5 月 14 日
回复了 Myarms 创建的主题 Linux 请问大家怎么啃 man page?
有些man写得感觉很晦涩,还是google一下具体用法比较舒服……
2015 年 5 月 14 日
回复了 xiaosen0624 创建的主题 程序员 这里有人在用 IRC 嘛?
@withrock 不会吧……我倒是没碰上
不过我只是偶尔会上去提个问,一般过了不久会有人解答,解决了我就退出……
2015 年 5 月 13 日
回复了 v2ex_user001 创建的主题 分享创造 文案狗,帮你寻找抖机灵的文案。 www.wenangou.com
本来以为会有人吐槽文案狗这个名字……结果发现一片叫好,我悄悄匿了……
在意大利吃过一种零食,咖啡豆外面包裹巧克力,直接吃
1  2  3  4  5  6  7  8  9  10  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   759 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 20:38 · PVG 04:38 · LAX 13:38 · JFK 16:38
♥ Do have faith in what you're doing.