🍰
Grasshopper ES por BetweenRealities
  • Using and Generating Documentation
    • GitHub
    • Discord
      • Speckle Webhooks
    • Speckle Client
  • Potencial technological implementations
  • 🧞Compute
    • Introducción a Grasshopper
      • Customizar Entorno
        • VSCode
      • Rhinoceros 3d
      • Hops
      • Galapagos
    • Modelos Informados
      • Comportamiento Estructural
        • Automatizar cálculo Python
      • OOP
      • Rhino Inside Revit
        • Revit
          • Modelado 3d en Revit
          • Certificación profesional Revit
      • Energía
    • Procesos Urbanos
      • Automatizar Qgis
      • Librerías Python
      • Librerías Grasshopper
      • Stable Diffusion
    • Programación
      • RhinoPython
        • Anatomía del script
        • Python básico
        • Tuples, listas y diccionarios
        • Operadores y funciones
        • Ejecución condicional
        • Geometría
        • Clases
      • Multithread
  • 🪅Database
    • Lenguaje Python
      • Types and operations
      • Statements and syntax
      • Function and generators
      • Modules and packages
      • Classes and OPP
      • Exception and tools
      • Advance topics
    • Análisis de la Información
      • Comparison with SQL
      • Comparison with R / R libraries
      • Pandas
    • Abrir Acceso
      • Rest API Abierta
    • Blockchain Descentralización
  • 🕸️COLLECT
    • Captura de Datos
      • Raspberry Pi
        • Encendido y apagado automático
      • Arduino
      • UAS
      • Fotogrametría
        • Crashes
    • Técnicas Machine Learning
      • Clasificación
      • Computer Vision
    • Computación en la Nube
      • Contenedores
      • Azure
      • Ubuntu Server Deploy
      • PostgreSQL Server
      • Rhino Compute Deploy
  • 🍭INTERACT
    • Introducción a Unreal Engine
      • Ejecutar Python
      • Datasmith
      • Materiales
        • Crear PBR
        • Materiales Introducción
      • Iluminación
        • Iluminación Introducción
        • Raytraced Iluminación Cinemática
      • Assets Management
    • Interacción Inmersiva
      • Blueprints
        • Blueprints estandar
        • Blueprints Introducción
        • Diseño Nivel
      • Packaging
      • Performance
    • Interfaces Bidimensionales
Con tecnología de GitBook
En esta página
  • ¿Cuál es el proceso general para analizar datos con Python?
  • Analizando datos con Python

¿Te fue útil?

  1. Database

Análisis de la Información

AnteriorAdvance topicsSiguienteComparison with SQL

Última actualización hace 2 años

¿Te fue útil?

¿Cuál es el proceso general para analizar datos con Python?

The general process for analyzing data with Python typically involves the following steps:

  1. Collect and import the data that you want to analyze. This can be done using a variety of tools and techniques, depending on the source and format of the data.

  2. Clean and prepare the data for analysis. This typically involves tasks such as removing missing or duplicate values, transforming the data into a suitable format, and ensuring that the data is consistent and accurate.

  3. Explore the data to gain insights and understand its characteristics. This can involve visualizing the data, calculating summary statistics, and identifying patterns and trends.

  4. Apply appropriate statistical or machine learning methods to analyze the data. This can involve running statistical tests, fitting models to the data, or using algorithms to extract insights from the data.

  5. Interpret the results of the analysis and communicate them to others. This can involve presenting the findings in a report or visualizations, and explaining the implications and limitations of the analysis.

Overall, the process for analyzing data with Python involves several steps, from collecting and cleaning the data, to applying appropriate analysis methods, to interpreting and communicating the results.

Analizando datos con Python

1. Importar conjuntos de datos

dataframe.describe()

2. Organización de la información

df.replace(missing_values, new_values) data formatting: df.rename() data normalization (remap gh): scaling > .max(), Min-max > .min(), z-score > .mean().std() convert categorical variables to dummy variables: pd.get_dummies(df['fuel']

3. Análisis exploratorio de datos

Estadística descriptiva: df.describe(), box plot (quartile distribution), scatterplot Grouping data: groupby, pivot, heatmap Correlación: negative-positive linear relationship Correlación - Estadísticas: Pearson correlation, correlation heatmap Análisis de varianza ANOVA (analysis of variance): variation between groups means

4. Desarrollo de modelos

normalization > polynomial transform > linear regression Pipelines (normalization and polynomoal transform) > train pipeline Measures for in-sample evaluation:

5. Evaluación de modelo

Evaluación y refinamiento del modelo: in-ample data or training data, out-of-sample evaluation or test set Cross validation > score Overfitting and underfitting. Training error and test error Regresión de arista (ridge): ridge regression (train, predict, r^2) Grid search: hyperparameters to train the model (training, validation and test)

🪅
df.info