Comment spécifier l'utilisation d'un proxy IP national ?
Bonjour à tous ! Aujourd'hui, je suis ici pour vous parler de la façon de spécifier l'utilisation de l'IP proxy domestique, pour certains besoins de crawl des données du site web domestique ou besoin d'accéder à des ressources spécifiques domestiques pour les amis, spécifier l'utilisation de l'IP proxy domestique est très important. Laissez-moi donc vous expliquer cela en détail !
Qu'est-ce que l'IP Proxy ?
L'IP proxy est comme un intermédiaire, votre demande est d'abord envoyée au serveur proxy, puis le serveur proxy envoie la demande au serveur cible, et la réponse renvoyée par le serveur proxy vous est ensuite transmise par l'IP proxy. En utilisant l'IP proxy, vous pouvez cacher votre véritable adresse IP, et en même temps, vous pouvez obtenir l'adresse IP de l'emplacement du serveur proxy, de sorte que vous pouvez répondre à certains besoins spéciaux.
Obtenir l'IP du proxy national disponible
Pour spécifier l'utilisation de l'IP proxy domestique, nous devons d'abord obtenir l'IP proxy domestique disponible. Voici un moyen simple de l'obtenir en parcourant quelques sites web d'IP proxy.
Tout d'abord, nous devons utiliser la bibliothèque de requêtes de Python pour envoyer une requête afin d'obtenir le contenu de la page. L'exemple de code est le suivant :
demandes d'importation
url = 'http://www.example.com' # URL du site IP du proxy
response = requests.get(url)
content = response.text
Ensuite, nous pouvons utiliser des expressions régulières ou BeautifulSoup pour extraire les informations IP du proxy dans la page web. Voici un exemple d'utilisation d'une expression régulière avec l'exemple de code suivant :
importer re
pattern = r'd+.d+.d+.d+.d+:d+' Expression régulière pour l'adresse IP #
proxy_ips = re.findall(pattern, content)
Ensuite, nous devons vérifier la disponibilité de ces adresses IP de proxy. Nous pouvons enregistrer ces IP proxy disponibles vérifiées pour une utilisation ultérieure. L'exemple de code est le suivant :
def check_proxy_ip(proxy_ip) :
proxies = {
'https' : 'https://' + proxy_ip,
}
try.
response = requests.get('http://www.example.com', proxies=proxies, timeout=5)
if response.status_code == 200 : if response.status_code == 200 : if response.status_code == 200
retourne True
if response.status_code == 200 : return True
return False
except : return False
retour Faux
valid_proxy_ips = []
for proxy_ip in proxy_ips : if check_proxy_ip(proxy_ip)
if check_proxy_ip(proxy_ip) : valid_proxy_ips.append(proxy_ip).
valid_proxy_ips.append(proxy_ip)
print(proxy_valide)
Spécifier l'utilisation d'une IP proxy nationale
Maintenant que nous disposons des IP de proxy nationales disponibles, l'étape suivante consiste à spécifier leur utilisation. Nous pouvons le faire en utilisant la bibliothèque de requêtes de Python.
Tout d'abord, importez la bibliothèque requests et la bibliothèque random, la bibliothèque random est utilisée pour sélectionner de manière aléatoire une IP de proxy :
importer des demandes
importer aléatoire
# Ensuite, nous devons modifier les paramètres du proxy de requests avant d'envoyer la requête. L'exemple de code est le suivant :
proxy = random.choice(valid_proxy_ips) # Choisir aléatoirement une IP de proxy
proxies = {
'http' : 'http://' + proxy, 'http' : 'http://'
'https' : 'https://' + proxy,
}
# Ensuite, nous pouvons utiliser cette IP proxy pour envoyer des requêtes. L'exemple de code est le suivant :
url = 'http://www.example.com' # URL du site web cible
response = requests.get(url, proxies=proxies) # Envoi de la requête à l'aide de l'IP proxy
content = response.text # Traitement du contenu de la réponse
Grâce à l'opération décrite ci-dessus, nous avons réussi à spécifier l'utilisation de l'IP proxy nationale, et nous pouvons accéder sans problème à des ressources nationales spécifiques ou à des données de sites web nationaux.