**悲惨的站点,开站以来,百度的收录一直是一条~ 非常的凄惨。
于是小胖就找了瓜某请教相关问题,于是乎出现了以下主动提交给百度收录的小工具~**
- 链接尽量短
- 别出现特殊符号
- 链接最好带html
- 然后把网站链接全部导出来
- 百度资源平台-> 普通收录 -> 写个小软件提交
import requests
import re
from loguru import logger
# CONFIG START
HOST = "zhuoyue360.com"
TOKEN = ""
# CONFIG END
s = requests.Session()
html = ""
with open('a.html', encoding='utf-8') as f:
html = f.read()
link_list = re.findall(r'href="(.*?)"', html)
new_links = []
for link in link_list:
if link.find("www.zhuoyue360.com/category") != -1: # 分类页面
ret = s.get(link).text
link_list = re.findall(r'href="(.*?)"', ret)
for link in link_list:
if link.find(".html") != -1 and link.find(HOST): # 静态页
new_links.append(link)
for link in set(new_links):
headers = {
'Content-Type': 'text/plain'
}
ret = s.post(f"http://data.zz.baidu.com/urls?site={link}&token={TOKEN}", headers=headers, data=link).text
logger.info(f'提交链接: {link} , {ret}')