TPB sex study

De Pratiques en milieux numériques
Révision datée du 18 avril 2022 à 17:45 par Theophilegm (discussion | contributions) (Outils)
Aller à : navigation, rechercher

Projet

Il se passe des choses intéréssentes sur Internet. Cet espace virtuel ou les humains dialoguent, échangent, partagent une multitude d'informations à propos d'un spectre de sujets tellement important qu'il y a un certains nombre de règles nommé "Règles d'internets" qui dictent notamment que Tout choses, dans le monde physique et le monde virtuel à un équivalent erotisé et/ou pornographique.

The Pirate Bay est un site web ( ou plusieurs sites en tendemme) permettant de partager des contenues, souvant illégaux, comme des films, des série télévisé, des logiciels, et même des livres numériques et des pdfs. Les sites est divisé en rubriques, par exemples les contenues les plus télécharger de tout les temps.

❗Note: Le partage de ses contenue est à travers le


Scraping de The Pirate Bay section ebooks top 100, plus précisément tout contenue en lien avec des pratiques sexuelles, la pornographie, aide au relation (souvent hétéronormé), pour voir l'évolution au cours du temps des contenues les plus téléchargé dans le top 100 ainsi

Outils

Tout d'abord, le diagram des entitées relationelles est créer grâce à yEd graph editor


Fichier:Tpb scraper list.png|Diagramme relationnelle Exemple.jpg|Description 2

Utilise le framework Python de webcrawling Scrapy et MariaDB comme base de donnée relationnelle.

À travers PHPMyAdmin, la création des tables

Secondaire mais important, la mise en place de proxy vers tor avec Docker, Docker-compose comme contenaire, des scripts divers et Scrapy pour acceder à The Pirate Bay en échapant au bloquage DNS(Dynamique Name System) par les ISP(Internet Service Providers), le site permettant le téléchargement de contenue proteger par le droit d'auteur et le copyright et donc illégale.

La configuration est expliper ici: