Crear un dataframe en Python leyendo un fichero Excel

En la siguiente entrada vamos a crear un dataframe en Python leyendo un fichero Excel de una forma muy sencilla gracias a la librería pandas. Pero antes de todo, debes tener instalado Python, un interprete como Jupyter Notebook e instalar openpyxl . ¿Comenzamos?

Tabla de Contenidos ocultar

1 Especificaciones del entorno

2 Paso previo

3 Paso a paso

3.1 Método 1: Leer un fichero excel usando el método read_excel() de pandas.

3.2 Método 2: Leer un fichero excel especificando la hoja

3.3 Método 3: Leer columnas específicas utilizando el parámetro ‘usecols’

3.4 Método 4: Saltarse filas usando ‘skiprows’

3.5 Método 5: Establecer la ubicación de la cabecera y leer a partir de ella usando ‘header‘

3.6 Método 6: Leer varias hojas con ‘sheet_name’

Especificaciones del entorno

Paso previo

Para poder leer un fichero xlsx desde python primero debes tener instalado el modulo openpyxl. Abre tu símbolo del sistema e instálalo con el siguiente comando:

pip3 install openpyxl

Crear un dataframe en Python leyendo un fichero Excel

Paso a paso

Método 1: Leer un fichero excel usando el método read_excel() de pandas.

# importar librería pandas como pd
import pandas as pd
 
# leer la primera hoja del excel
dataframe1 = pd.read_excel('C:/tmp/Libro1.xlsx')
 
print(dataframe1)

Método 2: Leer un fichero excel especificando la hoja

# importar librería pandas como pd
import pandas as pd
 
# leer la primera hoja del excel
dataframe2 = pd.read_excel('C:/tmp/Libro1.xlsx', sheet_name = 'Hoja1')
 
print(dataframe2)

Método 3: Leer columnas específicas utilizando el parámetro ‘usecols’

# importar librería pandas como pd
import pandas as pd

require_cols = [0, 1, 4]
 
# leer la primera hoja del excel
dataframe3 = pd.read_excel('C:/tmp/Libro1.xlsx' , usecols = require_cols)
 
print(dataframe3)

Método 4: Saltarse filas usando ‘skiprows’

# importar librería pandas como pd
import pandas as pd
 
# saltarse las tres primeras filas
dataframe4 = pd.read_excel('C:/tmp/Libro1.xlsx' , skiprows = 3)
 
print(dataframe4)

Método 5: Establecer la ubicación de la cabecera y leer a partir de ella usando ‘`header`‘

# importar librería pandas como pd
import pandas as pd
 
# saltarse las tres primeras filas
dataframe5 = pd.read_excel('C:/tmp/Libro1.xlsx' , header= 2)
 
print(dataframe5)

Método 6: Leer varias hojas con ‘sheet_name’

# import libreria pandas como pd
import pandas as pd
 
# leer varias hojas
dataframe6 = pd.read_excel('C:/tmp/Libro1.xlsx' , sheet_name =['Hoja1', 'Hoja2'])
 
print(dataframe6)

Cookie	Duración	Descripción
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Crear un dataframe en Python leyendo un fichero Excel

Especificaciones del entorno

Paso previo

Paso a paso

Método 1: Leer un fichero excel usando el método read_excel() de pandas.

Método 2: Leer un fichero excel especificando la hoja

Método 3: Leer columnas específicas utilizando el parámetro ‘usecols’

Método 4: Saltarse filas usando ‘skiprows’

Método 5: Establecer la ubicación de la cabecera y leer a partir de ella usando ‘`header`‘

Método 6: Leer varias hojas con ‘sheet_name’

Escribir un comentario Cancelar la respuesta

Novedades de Power BI Julio 2024

Error en Tomcat al actualizar a MicroStrategy One Junio 2024

Novedades de Power BI Junio 2024

Simular HTTPS en MicroStrategy

Función CEIL en PostgreSQL

Remplazar un conjunto de datos en una tarjeta de HyperIntelligence