代码提高你的事情效率
目标:如上gif图,我们想要将表2中的在表1中有的元素提取出来,那如果是个大型数据呢,当然excel也可以搞定。
本日要先容的是在在大数据下是如何实现的。我们直接暴力出击吧 (^__^)
1. python脚本
#!/usr/bin/pythondict={}
for line in open(\"大众file1.txt\公众):
a=line.strip()
dict[a]=1
for line in open(\"大众file2.txt\"大众):
b=line.strip()
if dict.has_key(b):
f3.write(b)
f3.write(\"大众\n\"大众)
f3.close()
注:file1.txt和file2.txt的相同行被提取到same.txt
2. perl
perl -lne 'chomp;if(exists($h{$_})){print $_;}else{$h{$_}=1;}' file1 file2 >>same.txt啥?一句话吗?是滴!
perl的命令行操作,他便是这么大略。
以是,py和pl并没有说谁比谁更啥,看你喜好,看你习气。不过py的面向工具的思想,是值得一学的。
涂鸦之作,欢迎相互谈论。特殊是就内存管理上。