最近用bs4处理xml文件,遇到了一个在爬虫时候从未思考过的问题——
修正从xml文件中解析出的文件树,并将changes保存到原来的xml文件中。
我一直在beautifulsoup的手册中去寻找库函数,实际只需要简单的文件读写操作:
1 | from bs4 import BeautifulSoup |
附一个简单xml文件用来实验:
1 | <?xml version="1.0" encoding="utf-8"?> |
最近用bs4处理xml文件,遇到了一个在爬虫时候从未思考过的问题——
修正从xml文件中解析出的文件树,并将changes保存到原来的xml文件中。
我一直在beautifulsoup的手册中去寻找库函数,实际只需要简单的文件读写操作:
1 | from bs4 import BeautifulSoup |
附一个简单xml文件用来实验:
1 | <?xml version="1.0" encoding="utf-8"?> |