首页 » SEO优化 » php掏出雷同元素技巧_提取相同数据的几种方法

php掏出雷同元素技巧_提取相同数据的几种方法

duote123 2024-11-05 0

扫一扫用手机浏览

文章目录 [+]

代码提高你的事情效率

目标:如上gif图,我们想要将表2中的在表1中有的元素提取出来,那如果是个大型数据呢,当然excel也可以搞定。

php掏出雷同元素技巧_提取相同数据的几种方法

本日要先容的是在在大数据下是如何实现的。
我们直接暴力出击吧 (^__^)

php掏出雷同元素技巧_提取相同数据的几种方法
(图片来自网络侵删)

1. python脚本

#!/usr/bin/python

f3=open(\"大众same.txt\"大众,'w')

dict={}

for line in open(\"大众file1.txt\"大众):

a=line.strip()

dict[a]=1

for line in open(\"大众file2.txt\"大众):

b=line.strip()

if dict.has_key(b):

f3.write(b)

f3.write(\"大众\n\公众)

f3.close()

注:file1.txt和file2.txt的相同行被提取到same.txt

2. perl

perl -lne 'chomp;if(exists($h{$_})){print $_;}else{$h{$_}=1;}' file1 file2 >>same.txt

啥?一句话吗?是滴!
perl的命令行操作,他便是这么大略。

以是,py和pl并没有说谁比谁更啥,看你喜好,看你习气。
不过py的面向工具的思想,是值得一学的。

涂鸦之作,欢迎相互谈论。
特殊是就内存管理上。

标签:

相关文章

今日头条算法岗三面算法工程师的面试之路

大数据和人工智能技术逐渐成为各行各业的热门话题。今日头条作为中国领先的资讯平台,其算法岗位一直是求职者争相竞逐的焦点。本文将针对今...

SEO优化 2025-01-31 阅读3 评论0

今日头条算法如何打造个化内容推荐

在移动互联网时代,信息爆炸已成为常态。如何在海量信息中找到自己感兴趣的内容,成为了一个亟待解决的问题。今日头条作为一款备受瞩目的新...

SEO优化 2025-01-31 阅读1 评论0

今日头条算法推荐其弊端与反思

算法推荐已经成为各大平台的核心竞争力。今日头条作为国内领先的资讯平台,凭借其强大的算法推荐系统,吸引了大量用户。在享受算法带来的便...

SEO优化 2025-01-31 阅读1 评论0

今日头条算法思维导图信息推荐的奥秘

信息传播速度越来越快,用户对信息的需求也越来越多样化。今日头条作为一款备受关注的新闻资讯平台,其背后的算法推荐机制一直是业界关注的...

SEO优化 2025-01-31 阅读1 评论0