Saltar al contenido

Presentamos TextBlob

septiembre 29, 2021
1TwsI 4s6fGMSAi 2t19qA

Presentamos TextBlob

Una biblioteca de Python para procesar datos textuales, marco de PNL, análisis de sentimientos

Susan Li

9 de enero de 2019·5 min de lectura

Los datos

JSON_parquet.py
1*ewlrZPawoMfm3tna stGzw

tabla de usuario
1*tvq5fT

tabla de revisión
user_review = (review.merge(user, on='user_id', how='left', suffixes=['', '_user']).drop('user_id', axis=1))user_review = user_review[user_review.stars > 0]

Distribución de clasificación por estrellas

x=user_review['stars'].value_counts()
x=x.sort_index()
plt.figure(figsize=(10,6))
ax= sns.barplot(x.index, x.values, alpha=0.8)
plt.title("Star Rating Distribution")
plt.ylabel('count')
plt.xlabel('Star Ratings')
rects = ax.patches
labels = x.values
for rect, label in zip(rects, labels):
height = rect.get_height()
ax.text(rect.get_x() + rect.get_width()/2, height + 5, label, ha='center', va='bottom')
plt.show();

Figura 1

Reseñas por año frente a calificaciones por estrellas por año

fig, axes = plt.subplots(ncols=2, figsize=(14, 4))
user_review.year.value_counts().sort_index().plot.bar(title='Reviews per Year', ax=axes[0]);
sns.lineplot(x='year', y='stars', data=user_review, ax=axes[1])
axes[1].set_title('Stars per year');
1*Bs vGoqdFqoqhqAj7zhRdg

Figura 2
user_review.member_yrs.value_counts()
1*a Bj1wWYLGepSCSw2uE3 w

figura 3
review_sample = user_review.text.sample(1).iloc[0]
print(review_sample)
close