lrjia's recent timeline updates
lrjia

lrjia

V2EX member #490604, joined on 2020-05-20 21:03:16 +08:00
Today's activity rank 8919
Per lrjia's settings, the topics list is hidden
Deals info, including closed deals, is not hidden
lrjia's recent replies
提工单
把 M 设成所有正整数和的一半就是分区问题了
先 hash ,按照 hash 前缀分块成多个文件,使分块后单块的大小可以放入内存。再对每块使用 hash 表去重。最后合并多个文件,用归并排序的做法。这中间应该都是文件的顺序读写。
可以把 name 分组,比如先把两个文件中所有 a 开头的行读入内存比较,然后再比较 b 、c 。分组粒度大小按照内存大小来。
ac 自动机 + trie 。记 ac 自动机匹配到的关键字个数为 n ,最终匹配到的规则数为 m 。复杂度最差应该是 O(min(2^n, 10w * n)),一般情况应该是 O(nm) https://pastebin.ubuntu.com/p/JbcMYQqHfp/
@print1024 #15 不用循环查找的,做一个倒排索引就行了
要区分两个概念,DNA 中的信息量算是强人工智能的“代码”(.py 文件),而不是完整模型(包括训练完成之后的参数),后者的信息量要大很多。
Jun 13, 2023
Replied to a topic by yedaxia 分享发现 似乎没有办法阻止 chatGPT 合并句子
尝试加入序号,以及保留原文,尝试了几次没有出现合并。

prompt:

你将担任一名台词翻译家,我将以字典的形式提供给你需要翻译的内容。

翻译规则:目标语言是英文,请记住每个句子作为一个独立句子翻译,请分别翻译它们,不要试图合并句子内容来翻译,即便为了语句通顺也不要这样做,翻译后的句子个数必须和输入的句子个数严格完全一致。

输出规则: 以字典的形式返回翻译结果,并携带原文。

输入输出示例如下:

输入示例:
1. 需要翻译的句子

输出示例:
{
"1": {
"chinese": "需要翻译的句子",
"english": "Sentences that need to be translated"
}
}

下面请翻译如下句子:
1. "我是在互联网行业工作了八年的 u i 设计师大双"
2. "嗯,跟大家简单介绍一下我自己"
3. "呃,我当年之所以选择做 u i 设计师"
4. "主要是想进入互联网这个行业"
5. "因为在当时互联网"
6. "非常的热门"
7. "实现自己的梦想也好"
如果把搜索的范围局限在本地的历史记录里,只搜索之前打开过的网页,技术上应该没问题
Sep 12, 2022
Replied to a topic by wdc63 程序员 由两个整数生成一个独特的整数
直接用位运算,可能还会更快一些 ((int64)a << 32) & (int64)b
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   6352 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 02:34 · PVG 10:34 · LAX 19:34 · JFK 22:34
♥ Do have faith in what you're doing.