Proyecto utilizando pensamiento computacional y Python en el área de estadística descriptiva con datos ficticios de venta de artículos de lujo.

  Este proyecto se centrará en realizar un Análisis Exploratorio de Datos (EDA) y destacará gráficos para visualizar la distribución y relaciones entre las variables.





Paso 1: Definir el objetivo del proyecto

El objetivo podría ser analizar las características de las ventas de artículos de lujo, identificar patrones de compra y describir la distribución de las variables clave.

Paso 2: Recopilar datos ficticios

Generaremos datos ficticios para simular las ventas de artículos de lujo. Utilizaremos la biblioteca Faker para crear nombres de productos, precios, fechas de compra y categorías de productos.


from faker import Faker import random import pandas as pd fake = Faker() # Generar datos ficticios def generate_fake_data(num_records=1000): data = [] for _ in range(num_records): data.append({ 'Fecha': fake.date_between(start_date='-1y', end_date='today'), 'Producto': fake.word(), 'Precio': round(random.uniform(100, 10000), 2), 'Categoria': random.choice(['Bolsos', 'Relojes', 'Joyas']), 'Cliente': fake.name(), 'Ciudad': fake.city(), }) return pd.DataFrame(data) # Crear DataFrame con datos ficticios luxury_data = generate_fake_data()

Paso 3: Análisis Exploratorio de Datos (EDA)

Realizaremos un análisis exploratorio de datos para obtener información clave sobre las ventas de artículos de lujo.

# Ver las primeras filas del DataFrame print(luxury_data.head()) # Obtener estadísticas descriptivas print(luxury_data.describe()) # Visualizar la distribución de precios de los productos import seaborn as sns import matplotlib.pyplot as plt plt.figure(figsize=(10, 6)) sns.histplot(luxury_data['Precio'], kde=True, color='skyblue') plt.title('Distribución de Precios de Artículos de Lujo') plt.xlabel('Precio') plt.ylabel('Frecuencia') plt.show() # Visualizar la proporción de ventas por categoría plt.figure(figsize=(8, 5)) luxury_data['Categoria'].value_counts().plot(kind='bar', color='lightcoral') plt.title('Proporción de Ventas por Categoría de Artículos de Lujo') plt.xlabel('Categoría') plt.ylabel('Número de Ventas') plt.show()



Fecha Producto Precio Categoria Cliente \ 0 2023-05-08 I 2214.66 Bolsos Ashley Cox 1 2023-09-27 look 6990.37 Joyas Stephanie Harris 2 2023-02-11 investment 8638.62 Joyas Marcus Johnson 3 2023-05-29 school 422.22 Joyas Amy Lewis 4 2023-11-30 artist 4349.51 Joyas Richard Hoffman Ciudad 0 Lake Roberta 1 Lake Jillianmouth 2 Wolfmouth 3 South Steven 4 Stephanieview Precio count 1000.00000 mean 5085.44462 std 2795.42583 min 102.55000 25% 2817.20250 50% 5136.30500 75% 7402.34000 max 9964.53000




Paso 4: Conclusiones y recomendaciones

Basándonos en el análisis de estadísticas descriptivas y los gráficos generados, podemos concluir sobre la distribución de precios, las categorías más populares y posiblemente identificar patrones de compra. Además, podríamos proponer estrategias de marketing específicas para cada categoría de productos.

Este proyecto es un ejemplo básico y puede ser ampliado según las necesidades específicas del análisis. Se pueden agregar más variables, explorar relaciones entre variables o incluso utilizar técnicas de clustering para segmentar clientes.

Paso 5: Consideraciones personales finales


Es muy esclarecedor saber que la media de los datos muestra que en artículos de lujo se gasta 5085 unidades monetarias y que han sido 1000 personas las informantes, los valores mínimo y maximo van desde
102 unidades monetarias y que el valor de compra máximo es de 9964 unidades monetarias aproximadamente.
la desviación estándar es de 2795 Unid. monetarias y que el valor de la media es de 5136

Comentarios