spaCy
spaCy (pronunciación en inglés: [speɪˈsiː]) es una librería de software para procesamiento de lenguajes naturales, análisis de redes, reconocimiento de nombres de entidades desarrollado por Matt Honnibal y programado en lenguaje Python. Fue lanzado en febrero de 2015 estando su desarrollo activo y siendo utilizado en distintos entornos.
SpaCy | ||
---|---|---|
![]() | ||
Información general | ||
Tipo de programa | software libre y de código abierto | |
Desarrollador | Matt Honnibal | |
Lanzamiento inicial | febrero de 2015 | |
Licencia | Licencia MIT | |
Información técnica | ||
Programado en | Python | |
Versiones | ||
Última versión estable | 3.7.216 de octubre de 2023 | |
Enlaces | ||
Es software libre con Licencia MIT su repositorio se encuentra disponible en Github.
Características principales
- Tokenización no destructiva
- Compatibilidad con tokenización alfa para más de 65 idiomas[1]
- Soporte integrado para componentes de canalización entrenables, como reconocimiento de entidades nombradas, etiquetado de parte de la voz, análisis de dependencias, clasificación de texto, vinculación de entidades, entre otros
- Modelos estadísticos para 17 idiomas
- Aprendizaje multitarea con transformadores previamente entrenados como BERT
- Compatibilidad con modelos personalizados en PyTorch, TensorFlow y otros marcos
Usos
El software IA2[2] utiliza el motor de spaCy para realizar análisis de fallos judiciales con el objetivo de generar anonimato de cierta información.
Referencias
- Models & Languages - spaCy
- IA2: la plataforma argentina que transparenta y hace anónimos los fallos judiciales, La Nación, 9 de abril de 2021
Enlaces externos
Este artículo ha sido escrito por Wikipedia. El texto está disponible bajo la licencia Creative Commons - Atribución - CompartirIgual. Pueden aplicarse cláusulas adicionales a los archivos multimedia.