Stop guessing what′s working and start seeing it for yourself.
login ou enregistrement
Q&A
Question Center →

Semalt Expert: Comment extraire du texte à partir de pages Web

Bien qu'il y ait  outils de raclage  capables d'extraire des données à partir de plusieurs pages en quelques secondes, le seul moyen sûr d'extraire du texte à partir de pages Web a toujours été de mettre en évidence et de copier le texte. Mais cette méthode est un peu lourde surtout dans les cas où vous devez copier du texte à partir de plusieurs pages. En outre, les développeurs Web proposent des moyens de bloquer le contenu d'une page Web pour éviter de le «copier».

«Pour commencer, il existe diverses méthodes rapides d'extraction de texte à partir de pages Web. Selon la quantité de texte que vous voulez obtenir, vous pouvez choisir entre les modes suivants:

1. Méthode Save-page

Cette technique repose sur la capacité des navigateurs enregistrer une copie de la page Web actuelle localement. Pour ce faire, maintenez simplement les boutons Ctrl + S enfoncés ou vous pouvez cliquer avec le bouton droit sur la page et sélectionner Enregistrer la page dans le menu contextuel. Cela lancera une fenêtre d'explorateur qui vous obligera à spécifier certains attributs de la page Web.

Dans la section inférieure, il y a une option" filename "qui vous donnera l'opportunité de spécifier le nom du fichier de la page web. Il est important de noter que le navigateur créera aussi un dossier avec un nom similaire qui contiendra toutes les données attachées de la page Web telles que les images et les toiles de fond.

En dessous, il y a une option "enregistrer en tant que type" qui vous permet de spécifier quel type de fichier vous voulez sauvegarder Étant donné que nous sommes intéressés par le texte, sélectionnez Enregistrer en tant que ".txt", ce qui créera automatiquement un fichier texte contenant tout le texte de la page Web et pourra être édité à l'aide de n'importe quel traitement de texte. Pour copier des pages entières, il vous suffit d'ouvrir le fichier texte et de supprimer le texte inutile.

2. Ctrl + C et Ctrl + V méthode

C'est probablement le truc le plus ancien du livre, en utilisant seulement votre souris pour mettre en évidence le texte Pour extraire vous pouvez alors procéder à la copier et la coller ailleurs. Cette méthode est utile lorsque vous devez copier des extraits et les utiliser rapidement dans un autre document.

Pour ce faire, vous devez faire défiler jusqu'à la partie contenant le texte dont vous avez besoin, appuyez sur le bouton gauche de la souris et maintenez-le enfoncé pour passer du mode "navigation" au mode "highlight". Cela vous permettra de surligner le texte, pour ce faire, maintenez le bouton gauche de la souris enfoncé et déplacez le curseur pour mettre votre texte en surbrillance. Lorsque vous avez terminé, relâchez le bouton et faites un clic droit sur le texte que vous avez copié pour faire apparaître le menu de navigation. Il clique sur "copier" option pour copier le texte sélectionné.

Accédez au document texte dans lequel vous souhaitez enregistrer le texte et faites un clic droit pour afficher le menu et cliquez sur Coller.

Il est important de noter que vous pouvez choisir entre différents modes de collage, mais si vous êtes uniquement intéressé par le texte, cliquez sur coller en texte brut.

Post a comment

Post Your Comment

Skype

semaltcompany

WhatsApp

16468937756

Telegram

Semaltsupport