
一步步教你進行 Python REST API 身份驗證
量化指標(biāo)洞察
用戶心智挖掘
競品動態(tài)監(jiān)控
場景舉例:新品發(fā)布后,可通過 Amazon Reviews API 抓取競品在相同品類下 30 天內(nèi)新增評論量與差評比率,指導(dǎo)定價與功能優(yōu)化。
方案 | 優(yōu)勢 | 適用場景 |
---|---|---|
Apify Amazon Reviews Scraper | — 無需編寫爬蟲,一鍵配置;<br>— 內(nèi)置 IP 輪換與無頭瀏覽器渲染; | 快速原型驗證、小規(guī)模抓取 |
Scrapingdog Reviews API | — RESTful 接口,支持 JSON/CSV;<br>— 可結(jié)合自有腳本靈活處理; | Python/Node.js 二次開發(fā) |
Pangolin 評論采集 API | — 全球多站點覆蓋;<br>— SDK 多語言支持; | 跨域名競品對比 |
自建 Scrapy + Puppeteer | — 完全自主可控;<br>— 可定制反爬策略; | 高度定制與企業(yè)級大規(guī)模抓取 |
選擇合適的評論爬蟲與 API 服務(wù),是實現(xiàn)高效市場研究與競品分析的第一步。
以下示例展示如何使用 Scrapingdog Amazon Reviews API 在 Python 中批量抓取評論數(shù)據(jù):
import requests, time, pandas as pd
API_KEY = 'YOUR_SCRAPINGDOG_API_KEY'
DOMAIN = 'com'
def fetch_reviews(asin, page=1):
url = 'https://api.scrapingdog.com/reviews'
params = {
'api_key': API_KEY,
'asin': asin,
'domain': DOMAIN,
'page': page,
'sort_by': 'recent'
}
resp = requests.get(url, params=params, timeout=10)
resp.raise_for_status()
return resp.json().get('reviews', [])
def collect_reviews_for_asin(asin):
all_reviews = []
page = 1
while True:
reviews = fetch_reviews(asin, page)
if not reviews:
break
all_reviews.extend(reviews)
page += 1
time.sleep(1) # 防限流
return all_reviews
# 示例:批量抓取多個 ASIN
asins = ['B0BSHF7WHW', 'B08N5WRWNW']
data = []
for asin in asins:
reviews = collect_reviews_for_asin(asin)
for r in reviews:
r['asin'] = asin
data.extend(reviews)
df = pd.DataFrame(data)
df.to_csv('reviews_data.csv', index=False, encoding='utf-8-sig')
print(f"共抓取 {len(df)} 條評論,已保存至 reviews_data.csv")
該代碼演示了如何實現(xiàn)批量獲取商品評論數(shù)據(jù),并輸出結(jié)構(gòu)化 CSV,方便后續(xù)分析。
review_id
或內(nèi)容哈希去除重復(fù)評論;YYYY-MM-DD
;# 時間格式化示例
df['date'] = pd.to_datetime(df['date'].str.replace('Reviewed on ', ''), format='%B %d, %Y')
df['length'] = df['content'].apply(len)
情感傾向
利用 HuggingFace transformers
或 NLTK
對評論進行正負(fù)面分類。
from transformers import pipeline
sentiment = pipeline('sentiment-analysis')
df['sentiment'] = df['content'].apply(lambda x: sentiment(x)[0]['label'])
spaCy
分詞后,統(tǒng)計高頻關(guān)鍵詞(如 “battery”, “setup”, “quality”),并生成詞云,幫助洞察用戶關(guān)注點。可借助 Matplotlib、Plotly 或 Power?BI、Tableau 等工具快速制作專業(yè)化報表。
定時任務(wù)
cron
:0 3 * * * python3 fetch_and_analyze.py
報警與重試
數(shù)據(jù)入庫
憑借本文方法,開發(fā)者和運營團隊可快速搭建一套基于 Amazon Reviews API 的全流程競品分析系統(tǒng),深度挖掘用戶反饋,優(yōu)化產(chǎn)品與營銷,搶占行業(yè)先機。立即動手,開啟評論數(shù)據(jù)驅(qū)動的智能決策之旅!
原文引自YouTube視頻:https://www.youtube.com/watch?v=8QP0AeGkmc8