一个巨大文件的操作问题热

【一个巨大文件的操作问题热】

一个巨大文件的操作问题热

文章插图
巨量文件操作的一个热点介绍:有一个11G的文本文件,里面存储的格式是11000222 112211 112211 11111111111111 。类似于这种格式,一行一行,每一行都视为一个字符串 。怎么去掉里面重复的词?