Data Mining: Instagram Scraper (1)

Die Generation der sozialen Medien hat sich kontinuierlich verändert. Damals nutzten die meisten Menschen Facebook, um ihre Gedanken und Bilder zu teilen, und Facebook war der Ort, an dem Menschen online mit Freunden kommunizieren. Aber als unser Leben dauert nichts für immer. Irgendwann können wir leicht erkennen, dass die Popularität von Social Media von Facebook auf Instagram verlagert wurde. Mit der Zeit veröffentlichen nicht mehr viele Menschen ihre Idee, Bilder auf Facebook. Mögliche Gründe für diese Änderungen könnten sein, dass die alte Plattform, der Wunsch nach neuen Inhalten oder die Besonderheiten neuer sozialer Medien müde werden. Verschiedene Gründe wirken sich darauf aus. Vielleicht ist es etwas spät, darüber zu diskutieren, warum Menschen von Facebook zu Instagram gewechselt sind, weil es eine Weile her ist, seit Menschen Instagram nutzen und immer noch zu etwas anderem wie Snapchat oder was auch immer wechseln. Ich persönlich glaube jedoch, dass die Tatsache, dass sich nichts ändert, Wörter / Bilder sind, die Benutzer in sozialen Medien veröffentlichen. Sie enthalten viele Informationen über Menschen, Gesellschaft, Trends und soziale Tendenzen, sodass wir die Absicht von Menschen über soziale Medien unabhängig davon interpretieren können Was ist Social Media? Die Analyse von Social Media hilft Ihnen daher zu verstehen, welchen Trend die Menschen derzeit verfolgen. Der wichtigste Grund, warum ich mich auf Instagram konzentriert habe, ist, dass es auf das Foto spezialisiert ist. Anders als Facebook oder Tweeter konzentriert sich Instagram auf das Foto. Hauptsächlich schafft es eine bestimmte Art von sozialem Phänomen, das auf Bildern basiert. Instagram würde die Leute dazu bringen, ihren Wunsch durch Fotos zu implizieren, anstatt ihn direkt preiszugeben. Es ist ein interessanter Teil der Social-Media-Funktionen. Damals wollten Social-Media-Nutzer erzählen, was sie haben, was sie durch das Wort und die Fotos denken, aber heutzutage implizieren sie ihre Absicht und möchten, dass die Leute dies implizit oder heimlich bemerken. Entsprechend diesen Wünschen sind die Social-Media-Bilder auf Instagram zur Implikation für andere geworden. Dieser besondere Wunsch brachte die Leute erfolgreich dazu, zu Instagram zu wechseln. In diesem Punkt möchte ich etwas namens Instagram-Scraper für Leute teilen, die über Instagram lernen möchten.

Instagram-Scraper ist ein Tool, mit dem Sie die meisten Informationen auf Instagram veröffentlichen können, einschließlich Fotos, Bildunterschriften und Kommentare.

Weitere Informationen finden Sie jederzeit auf der offiziellen Website: https://github.com/rarcega/instagram-scraper

Die Installation von Instagram Scraper ist ziemlich einfach. Wenn Sie unter Linux arbeiten, können Sie einfach tippen. Es funktioniert immer noch unter Mac OS, wenn Sie pip bereits installiert haben.

pip install instagram-scraper

Nachdem Sie die Installation abgeschlossen haben, können Sie einfach eingeben

instagram-scraper -h

um alle Funktionen zu sehen, die instagram-scraper hat.

Verwendung: instagram-scraper [-h] [--destination DESTINATION]
[--login_user LOGIN_USER] [--login_pass LOGIN_PASS]
[--login_only] [--filename FILENAME] [--quiet]
[--maximum MAXIMUM] [--retain_username]
[--media_metadata] [--include-location]
[--media_types MEDIA_TYPES [MEDIA_TYPES ...]]
[--latest] [--tag] [--location] [--search-location]
[--comments] [--verbose VERBOSE]
[Benutzername [Benutzername ...]]
instagram-scraper kratzt und lädt die Fotos und Videos eines instagram-Benutzers herunter.
Positionsargumente:
Benutzername Instagram-Benutzer zu kratzen
optionale Argumente:
-h, --help Diese Hilfemeldung anzeigen und beenden
--Ziel ZIEL, -Z ZIEL
Ziel herunterladen
--login_user LOGIN_USER, -u LOGIN_USER
Instagram Login Benutzer
--login_pass LOGIN_PASS, -p LOGIN_PASS
Instagram Login Passwort
--login_only, -l Deaktiviert den anonymen Fallback, wenn die Anmeldung fehlschlägt
--Dateiname FILENAME, -f FILENAME
Pfad zu einer Datei mit einer Liste der zu durchsuchenden Benutzer
--quiet, -q Sei ruhig beim Schaben
--maximum MAXIMUM, -m MAXIMUM
Maximale Anzahl zu kratzender Gegenstände
--retain_username, -n
Erstellt ein Unterverzeichnis für den Benutzernamen, wenn das Zielflag ist
einstellen
--media_metadata Speichern Sie Medienmetadaten in einer JSON-Datei
--include-location Bezieht Standortdaten beim Speichern von Medienmetadaten ein
--media_types MEDIA_TYPES [MEDIA_TYPES ...], -t MEDIA_TYPES [MEDIA_TYPES ...]
Geben Sie die zu kratzenden Medientypen an
--latest Kratzen Sie neue Medien seit dem letzten Kratzen
--tag Scrape Media mit einem Hashtag
--location Scrape-Medien mit einer Standort-ID
--search-location Suche nach Orten nach Namen
--comments Speichern Sie Post-Kommentare in der JSON-Datei
--verbose VERBOSE, -v VERBOSE
Ausführlichkeitsstufe protokollieren
Sie können Ihre Anmeldeinformationen aus dem Verlauf ausblenden, indem Sie Ihre lesen
Benutzername aus einer lokalen Datei:
$ instagram-scraper @ insta_args.txt user_to_scrape
mit insta_args.txt sieht es so aus:
-u = mein_Benutzername
-p = mein_Kennwort

Dieser Schaber arbeitet auf verschiedene Arten effizient. Wenn Sie eine bestimmte Funktion suchen, sollten Sie die offizielle Website verbessern.

Wenn Sie jedoch an Data Mining arbeiten möchten, sollten Sie ein Skript ausführen, da instagram-scraper jeweils eine Abfrage bereitstellt. Obwohl sie die Funktion zum Abrufen einer Reihe von Benutzerfotos mit einer Befehlsfunktion bieten, möchten Sie möglicherweise verschiedene Optionen haben. Um Big Data von Instagram zu erhalten, schlage ich Python vor, um das Skript zum Senden mehrerer Abfragen zu erstellen.

Hier ist ein einfaches Beispiel für das Skript, um herauszufinden, welche Orte den Namen 'unmami burger' haben, der von Python ausgeführt wird

Importzeit des Import-Unterprozesses
location = 'umami burger' während True: p = subprocess.Popen (["instagram-scraper", "--search-location", location], stdout = subprocess.PIPE) Ausgabe, err = p.communicate () wenn Ausgabe ! = "": Druckausgabezeit.Schlaf (20)

Dies ist ein Skript zum Durchsuchen des in der Instagram-Datenbank gespeicherten Speicherorts. Es sollte der Suchmaschine auf der Instagram-Website entsprechen. Sie können dieses einfache Skript jederzeit bearbeiten, um die gewünschten Daten zu erhalten. Aber das, was Sie sicherstellen müssen, ist, zwischen jeder Abfrage Schlaf zu geben. Wenn Sie weiterhin Anfragen ohne Unterbrechung senden, sperrt Instagram Ihre IP für einen bestimmten Zeitraum. Es gibt keinen bestimmten Hinweis auf das Zeitlimit, in dem wir die Anzahl der Anfragen maximieren können, es sei denn, Instagram stellt dies offiziell zur Verfügung. Vielleicht möchten Sie testen, wie viel Schlafzeit Sie geben sollen. Es variiert je nach Anzahl der Bilder, Kommentare und Anzahl der Ausgaben nach der Suche.

Standort-Tags auf der Instagram-Website

Instagram Scraper Ausgabe:

Standort-ID: 62304541, Titel: Umami Burger, Untertitel: 432 6th Ave, Stadt :, Lat: 40.7344, Lng: -73.99861
Standort-ID: 292698230, Titel: Umami Burger, Untertitel: 225 Liberty St, Ste 247, Stadt :, Lat: 40.71156, Lng: -74.01533
Standort-ID: 19002234, Titel: Umami Burger, Untertitel: 338 S Anaheim Blvd, Anaheim, Kalifornien, Stadt: Anaheim, Kalifornien, lat: 33.8324803, lng: -117.9126456
Standort-ID: 11265111, Titel: Umami Burger, Untertitel: 2981 Bristol St, Ste B2, Costa Mesa, CA, Stadt: Costa Mesa, CA, Lat: 33.67915, Lng: -117.88604
Standort-ID: 87627717, Titel: Umami Burger, Untertitel: 1200 Franklin St, Ste 2190, Stadt :, Lat: 37.8025053, Lng: -122.2706073

Wenn Sie die Daten von 'Umami Burger in Anaheim, Kalifornien, erhalten möchten, können Sie einfach eine Anfrage mit der Standort-ID senden. Allerdings haben zu viele Leute diesen Ort mit ihren Bildern markiert. Ich werde die Anzahl der Bilder, die ich herunterladen werde, auf 300 beschränken und auch eine Metadatendatei erhalten. Die Metadatendatei wird als .json erstellt und enthält die Beschriftung, die Anzahl der LIKES und die meisten Daten, die ein Foto enthält.

instagram-scraper --location 19002234 -m 300 --media_metadata

Ausgabe:

Obwohl ich dachte, ich hätte die Anzahl der Bilder begrenzt, aber es hat nur 274 Bilder, was bedeutet, dass es 274 Bilder gibt, die Instagram-Benutzer mit dem Tag Umami Burger in Anaheim, Kalifornien, auf ihren Bildern versehen haben. In Ihrem Ordner sehen Sie eine Reihe von Bildern und .json-Dateien.

Instagram-Scraper ist das leistungsstarke Tool zum Sammeln von Daten von Instagram. Ich habe nur mitgeteilt, wie das Standort-Tag durchsucht wird, aber Sie können damit viel mehr Daten erhalten.

Hoffe das hilft und ich werde einige Kooperationen mit Instagram Scraper und Yelp teilen!