Data-cleaner

Latest version: v0.2.0

Safety actively analyzes 621239 Python packages for vulnerabilities to keep your Python projects secure.

Scan your dependencies

Page 1 of 2

0.2.0

------------------

* Se completa migración a python 3.7 y se discontinúa soporte a python 2. Se actualizan todas las dependencias.

0.1.19

------------------

* Se agrega funcionalidad para leer archivos geográficos (SHP) y guardarlos en CSV con una columna GEOJSON, principalmente para compatibilidad con CKAN. Se lee la proyección en el .prj (si este existe) y se re-proyecta por default a EPSG 4326, salvo se especifique lo contrario.
* Se agrega capacidad de leer archivos excel en XLSX.

0.1.18

------------------

* Se agrega un parámetro opcional (`lower_words`) al método `nombre_propio`, para especificar palabras que no se capitalizan.

0.1.16

------------------

* Se remueven los caracteres de salto de línea de todos los valores.
* Se detectan los fields con títulos que usan la convencion upper CamelCase para interpretar que cada mayúscula comienza una palabra distinta

0.1.15

------------------

* Se arregla un bug en los métodos que operan con strings que transformaba missings nan de pandas en strings "nan".
* Se corrige capitalizer para evitar errores con cadenas de texto vacías.

0.1.14

------------------

* Se modifica la interfaz del algoritmo de clusterización de strings, agregando parámetros para sorting de tokens y remoción de duplicados de tokens. Ahora el algoritmo es extremadamente seguro, el default está en False en ambos casos con lo cual no reordena tokens ni elimina duplicados.
* El método clean no permite guardar un dataset en un CSV con formato que no sea el estándar.
* Las columnas nuevas se agregan en orden, justo después de las originales.
* Nueva regla de limpieza: reemplazo simple de strings (*reemplazar_string*).

Page 1 of 2

© 2024 Safety CLI Cybersecurity Inc. All Rights Reserved.