最近用echarts做一个散点地图的视频动画,遇到一个问题——找来的GPS文件有50G,用常用的Nodepad++等文字编辑软件无法打开,所以只好利用Python逐行分割文件。
运行环境:Windows 10家庭版及以上。
第一步:安装python。
在cmd命令行输入python,如果你没有安装python,程序会直接跳转到Windows Store的Python安装页面,直接进行安装。或者在Windows Store中直接搜索Python。
第二步:新建文件分割程序。
新建一个文本文件,然后命名为split_txt.py,也可以命名其他名字,只要后缀是py就行,然后输入如下内容,将D:\TDDownload\simple-gps-points-120312.txt替换为自己的文件路径:
import io
LIMIT = 150000
file_count = 0
url_list = []
with io.open('D:\TDDownload\simple-gps-points-120312.txt','r',encoding='utf-8') as f:
for line in f:
url_list.append(line)
if len(url_list) < LIMIT:
continue
file_name = str(file_count)+".txt"
with io.open(file_name,'w',encoding='utf-8') as file:
for url in url_list[:-1]:
file.write(url)
file.write(url_list[-1].strip())
url_list=[]
file_count+=1
if url_list:
file_name = str(file_count) + ".txt"
with io.open(file_name,'w',encoding='utf-8') as file:
for url in url_list:
file.write(url)
print('done')
第三步:运行python脚本。
在cmd命令行运行
>python split_txt.py
这样原来的超大文件就会被逐行读取,然后自动拆分为最大150000行的文本文件。