Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
Gandum
V2EX  ›  Linux

各位 V 友,在 Linux 中下载的中国知网论文,标题是乱码,请教简便地如何使标题恢复正常

  •  
  •   Gandum · Mar 28, 2015 · 10950 views
    This topic created in 4076 days ago, the information mentioned may be changed or developed.

    例如,我想下载一篇题为《数学归纳法的发展历程》的论文,下载工具是Chrome,但是下载下来的文件会变成Êýѧ¹éÄÉ·¨µÄ·¢Õ¹Àú³Ì_·ë½ø.pdf

    目前已经想出一种方法:先压缩成zip文件,然后设定LANG=C用7z解压,解压后再转换编码

    zip a.zip *
    LANG=C 7z x a.zip
    convmv -f gbk -t utf8 --notest -r .

    压缩再解压这种方法无疑过于繁琐,而且文件数量多的话肯定不合适,毕竟这应该是一个只涉及到重命名文件的问题,不知各位V友有什么简便的方法。

    本人知识背景:非程序员,希望能够用Shell或者Python解决这个问题

    非常感谢!

    19 replies    2018-11-22 21:40:05 +08:00
    limbo0
        2
    limbo0  
       Mar 28, 2015
    许多论文没有pdf!
    许多pdf里面都是乱码!
    Gandum
        3
    Gandum  
    OP
       Mar 28, 2015
    @xinhugo 额。。兄台这不是答非所问么
    muzuiget
        4
    muzuiget  
       Mar 28, 2015   ❤️ 6
    这种烂网站几乎都是坚守 GBK 编码的,我老早前就喷过了,还写了个 Firefox 扩展

    http://qixinglu.com/post/redisposition.html

    至于本地的乱码文件名呢(解压一些 zip 经常遇到),自己撸了个 Python 脚本解决。

    https://github.com/muzuiget/python-scripts/blob/master/utf8-filename.py

    $ ls
    Êýѧ¹éÄÉ·¨µÄ·¢Õ¹Àú³Ì_·ë½ø.pdf
    $ utf8-filename *
    数学归纳法的发展历程_冯进.pdf
    Goooogle
        5
    Goooogle  
       Mar 28, 2015   ❤️ 2
    @limbo0
    硕士博士论文只是没有直接提供下载链接而已
    http://a-nerd.info/?p=1795
    lusyoe
        6
    lusyoe  
       Mar 28, 2015 via Android
    如果用的是Ubuntu可以下一个nautilus扩展解决这个问题,nautilus-filename-repairer
    Gandum
        7
    Gandum  
    OP
       Mar 28, 2015
    @muzuiget 多谢,您的脚本十分好用!
    xinhugo
        8
    xinhugo  
       Mar 28, 2015
    @Gandum 第一条搜索结果,就是解决方案,怎么答非所问了?
    hitsmaxft
        9
    hitsmaxft  
       Mar 28, 2015 via iPhone
    alas convmv=convmvfunc(){mv $1 "$(echo $1|iconv -f gbk)" }

    大概这样,手机上不好验证
    s51431980
        10
    s51431980  
       Mar 28, 2015
    试试 convmv

    ```
    sudo apt-get install convmv
    man convmv
    ```
    Gandum
        11
    Gandum  
    OP
       Mar 28, 2015
    @lusyoe 从网站下载后文件已经被认定为UTF-8编码,这个扩展不起作用的。Thank you anyway.
    RecursiveG
        12
    RecursiveG  
       Mar 28, 2015   ❤️ 1
    echo -n 'Êýѧ¹éÄÉ·¨µÄ·¢Õ¹Àú³Ì_·ë½ø.pdf' | iconv -f utf8 -t iso-8859-1 | iconv -f gbk -t utf8
    ynyounuo
        13
    ynyounuo  
       Mar 28, 2015
    @RecursiveG
    正想说可以用 iconv
    kongdeyuan
        14
    kongdeyuan  
       Mar 29, 2015
    解决的办法 确实很多学习了,感谢。我这条回复属于垃圾信息吗。。。
    xieyudi1990
        15
    xieyudi1990  
       Mar 29, 2015 via iPhone
    每次在Linux下用tar打包文件名带中文的文件时, 发给用gbk的中文Windows的人解压也是各种问题.
    hitsmaxft
        16
    hitsmaxft  
       Mar 29, 2015   ❤️ 1
    @hitsmaxft 最后来个完整版本
    ```
    convmv(){ mv "$1" $(echo -n "$1" | iconv -f UTF-8 -t ISO-8859-1 | iconv -f gbk)}
    ```

    ```
    convmv 'Êýѧ¹éÄÉ·¨µÄ·¢Õ¹Àú³Ì_·ë½ø.pdf'
    ```
    vjnjc
        17
    vjnjc  
       Mar 29, 2015
    enca -L zh_CN -x UTF-8 file1
    试试这个,我一直用它来搞定gbk乱码的
    yanwen
        18
    yanwen  
       Jul 2, 2016
    @muzuiget 你好啊 你网站 http://qixinglu.com/post/redisposition.html 打不开了。。。 这个扩展还有不??求一份 y4nwen#gmail.com
    wangzilinn
        19
    wangzilinn  
       Nov 22, 2018
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3854 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 69ms · UTC 10:23 · PVG 18:23 · LAX 03:23 · JFK 06:23
    ♥ Do have faith in what you're doing.