域名提取清洗工具python代码

Python代码作者:sslake日期:2021-04-06点击:521

如下所示,python3环境下,python实现将www.ttrar.cn处理为ttrar.cn的结果。

首先,打开域名提取.py文件

# -*- coding:utf-8 -*-import sys
reload(sys)
sys.setdefaultencoding('utf8')

with open('yuming.txt', 'r') as f:
    urllist = f.readlines()
for i in urllist:
    print(i)
    i=i.strip("\n")
    site=i.split(".")[-2] #[1]参数,则去blog.qq.com的QQ,    print (site)
    try:
        with open('yumingjieguo.txt', 'a') as a:
            a.write(site+'.com\n')
            #time.sleep(0.1)    except IOError, e:
        print 'error:'(site)


根据yuming文件下的域名列表,筛选出.com域名并输出到域名结果.txt的文本文件中。

yuming.txt每行一个,为com域名

yumingjieguo.txt则为清洗后的域名


下一篇       上一篇

粤ICP备20010543号