lrjia's recent timeline updates

lrjia

V2EX member #490604, joined on 2020-05-20 21:03:16 +08:00

Today's activity rank 8919

lrjia 提问技术话题好玩工作信息交易信息城市相关

Per lrjia's settings, the topics list is hidden

Deals info, including closed deals, is not hidden

lrjia's recent replies

Aug 2, 2025

Replied to a topic by jonsshyu › 云计算 › 阿里云每晚 7： 45~8： 30 严重丢包，有啥优化方案吗？

提工单

Apr 12, 2025

Replied to a topic by loverorser › 算法 › 去楼下超市买东西发现个活动，满 18 送可乐一瓶，发现有点意思

把 M 设成所有正整数和的一半就是分区问题了

Jun 2, 2024

Replied to a topic by drymonfidelia › 程序员 › 要对单个 6.20TB 的超大 csv 文件保持顺序的情况下进行去除重复行，有什么好思路？显然不可能加载进内存

先 hash ，按照 hash 前缀分块成多个文件，使分块后单块的大小可以放入内存。再对每块使用 hash 表去重。最后合并多个文件，用归并排序的做法。这中间应该都是文件的顺序读写。

Feb 15, 2024

Replied to a topic by FeifeiJin › 程序员 › 超大型文件比较，内存不足，只能分页读区再匹配，但头都秃了，也没想到优化的方式，朋友们帮帮忙啊。

可以把 name 分组，比如先把两个文件中所有 a 开头的行读入内存比较，然后再比较 b 、c 。分组粒度大小按照内存大小来。

Feb 6, 2024

Replied to a topic by print1024 › Java › Java 多字符串同时匹配文本，消耗 CPU 过高，如何优化？

ac 自动机 + trie 。记 ac 自动机匹配到的关键字个数为 n ，最终匹配到的规则数为 m 。复杂度最差应该是 O(min(2^n, 10w * n))，一般情况应该是 O(nm) https://pastebin.ubuntu.com/p/JbcMYQqHfp/

Feb 5, 2024

Replied to a topic by print1024 › Java › Java 多字符串同时匹配文本，消耗 CPU 过高，如何优化？

@print1024 #15 不用循环查找的，做一个倒排索引就行了

Oct 13, 2023

Replied to a topic by fanym › 问与答 › 强人工智能的实现代码量估计只有 0.65952MB？

要区分两个概念，DNA 中的信息量算是强人工智能的“代码”（.py 文件），而不是完整模型（包括训练完成之后的参数），后者的信息量要大很多。

Jun 13, 2023

Replied to a topic by yedaxia › 分享发现 › 似乎没有办法阻止 chatGPT 合并句子

尝试加入序号，以及保留原文，尝试了几次没有出现合并。

prompt:

你将担任一名台词翻译家，我将以字典的形式提供给你需要翻译的内容。

翻译规则：目标语言是英文，请记住每个句子作为一个独立句子翻译，请分别翻译它们，不要试图合并句子内容来翻译，即便为了语句通顺也不要这样做，翻译后的句子个数必须和输入的句子个数严格完全一致。

输出规则: 以字典的形式返回翻译结果，并携带原文。

输入输出示例如下：

输入示例：
1. 需要翻译的句子

输出示例：
{
"1": {
"chinese": "需要翻译的句子",
"english": "Sentences that need to be translated"
}
}

下面请翻译如下句子：
1. "我是在互联网行业工作了八年的 u i 设计师大双"
2. "嗯，跟大家简单介绍一下我自己"
3. "呃，我当年之所以选择做 u i 设计师"
4. "主要是想进入互联网这个行业"
5. "因为在当时互联网"
6. "非常的热门"
7. "实现自己的梦想也好"

Nov 19, 2022

Replied to a topic by kongkongye › 奇思妙想 › 有个任意网页弹窗搜索的 idea，但好像不大可行？

如果把搜索的范围局限在本地的历史记录里，只搜索之前打开过的网页，技术上应该没问题

Sep 12, 2022

Replied to a topic by wdc63 › 程序员 › 由两个整数生成一个独特的整数

直接用位运算，可能还会更快一些 ((int64)a << 32) & (int64)b

» More replies by lrjia