Skip to content

Ein Datensatzbeispiel der am häufigsten bewerteten und meistverkauften Bücher auf Amazon

Notifications You must be signed in to change notification settings

bright-data-de/Amazon-popular-books-dataset

Repository files navigation

Amazon-popular-books-dataset

Ein GitHub-Datensatz der am häufigsten rezensierten und meistverkauften Bücher auf Amazon. Dieser Amazon-Datensatz enthält mehr als 190.000 meistverkaufte Bücher. Jeder Buchtitel in diesem Amazon-Datensatz hat 10.000 Leserrezensionen oder mehr erhalten, wodurch sie als die beliebtesten verfügbaren Bücher hervorstechen.

Wichtige Datenpunkte, die in diesem kostenlosen Datensatz enthalten sind:

  • ASIN
  • ISBN10
  • Categories
  • Reviews count
  • Avg. rating
  • Number of sellers
  • URL
  • Image
  • Final price
  • Title
  • Description
  • Availability

Amazon dataset sample

Wie wurde dieser Amazon-Datensatz erstellt

Dies ist eine Beispiel-Teilstichprobe, die aus dem Datensatz „Amazon bestseller products (public data)“ geforkt wurde, der insgesamt 1.742.990 Amazon-Bestseller-Produkte umfasst. Die Daten wurden exklusiv von Amazon mit dem Bright Data Amazon Scraper extrahiert, der rotierende Residential Proxies und die Web Unlocker-Infrastruktur integriert.

Der vollständige Datensatz, der in der 2. Woche im Mai extrahiert wurde, wurde mithilfe intelligenter Filterabfragen, die im Bright Data Datasets-Control-Panel verfügbar sind, auf eine kleinere Teilmenge reduziert.

Für das Filtern dieser Amazon-Datenteilmenge verwendete Datenpunkt-Filterabfragen:

  •   categories: "Books"
    
  •   reviews_count: {"$gte":10000}
    

Zusätzliche Filterabfragewerte, die verwendet werden können: ASIN, brand, # of sellers, price after discount, timestamp, best-seller rank, and more.

Datensätze werden auf snowflake gehostet, um maximale Filter- und Anzeige-Geschwindigkeiten zu erreichen.

Verfügbare Datensatz-Dateiformate: JSON, NDJSON, CSV, XLSX.

Optionen für den Datensatz-Bereitstellungstyp: API download, Amazon S3, Google cloud, Microsoft Azure, SFTP.

Kaufen Sie den vollständigen Datensatz auf der Bright Data's Amazon datasets page. Der Kauf einer kleineren Teilmenge nach der Nutzung intelligenter Filter kann den Endpreis reduzieren. Dieser Datensatz ist mit monatlichen / wöchentlichen / täglichen Aktualisierungen verfügbar und die Bereitstellung dauert nur 1 Tag.

Weitere eCommerce-Datensätze verfügbar von Bright Data:

  • 1,000,000 "Amazon Sellers"
  • 544,000,000 "Amazon Products and Reviews"
  • 375,000,000 "Walmart products and Reviews" - Erfahren Sie mehr über den Walmart Dataset here.

Kostenloser Zugang zu Webdaten-Erfassungstools und Datensätzen für akademische Forschende und NGOs

Die Bright Initiative bietet akademischen Fakultäten, NGOs und NPOs, die verschiedene Umwelt- und soziale Anliegen fördern, Zugang zur Webdaten-Erfassungsplattform von Bright Data. Sie können hier einen Antrag einreichen.

About

Ein Datensatzbeispiel der am häufigsten bewerteten und meistverkauften Bücher auf Amazon

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published