域名提取清洗工具python代码
Python代码作者:sslake日期:2021-04-06点击:669
如下所示,python3环境下,python实现将www.ttrar.cn处理为ttrar.cn的结果。
首先,打开域名提取.py文件
# -*- coding:utf-8 -*-import sys reload(sys) sys.setdefaultencoding('utf8') with open('yuming.txt', 'r') as f: urllist = f.readlines() for i in urllist: print(i) i=i.strip("\n") site=i.split(".")[-2] #[1]参数,则去blog.qq.com的QQ, print (site) try: with open('yumingjieguo.txt', 'a') as a: a.write(site+'.com\n') #time.sleep(0.1) except IOError, e: print 'error:'(site)
根据yuming文件下的域名列表,筛选出.com域名并输出到域名结果.txt的文本文件中。
yuming.txt每行一个,为com域名
yumingjieguo.txt则为清洗后的域名