Haga clic en el botón "Seleccionar archivo" de arriba y elija su archivo VOCAB.
Verás una vista previa, si está disponible.
Haga clic en el botón "Convertir archivo a..." para extraer información de texto.
Convertir VOCAB a otro tipo de archivo
Para convertir archivos de vocabulario VOCAB a otro formato, necesita SentencePiece o otro software Desarrollador.
Convertir un archivo a VOCAB
Para convertir otros formatos de archivo al tipo de archivo "Lista de vocabulario de aprendizaje automático", necesita SentencePiece o software similar.
Acerca de los archivos VOCAB
Un archivo .VOCAB almacena la lista de vocabulario o los datos del tokenizador utilizados por los modelos de Procesamiento de Lenguaje Natural (NLP). Comúnmente generados por bibliotecas de aprendizaje automático como TensorFlow, SentencePiece o fastText, estos archivos mapean tokens de texto (palabras, subpalabras o caracteres) a identificadores numéricos. A menudo incluyen puntuaciones de frecuencia de palabras para ayudar al modelo de IA a ponderar la importancia de los tokens durante el entrenamiento o la inferencia.
El problema: El formato carece de estandarización y está muy fragmentado. Algunos archivos .VOCAB son simples documentos de texto separados por tabulaciones, mientras que otros son objetos binarios serializados creados por Python (similares a los archivos PKL). Las versiones serializadas son completamente ilegibles fuera del entorno de programación específico que las creó. Además, incluso las versiones de texto sin formato son difíciles de analizar, filtrar o fusionar utilizando software de oficina estándar. Esto hace que depurar problemas de tokenización o inspeccionar manualmente el vocabulario de un modelo sea una tarea frustrante para desarrolladores y científicos de datos.
La solución: Convertir el archivo desbloquea los datos para su inspección y uso compartido. Para el análisis y filtrado de datos, convierte .VOCAB a CSV para abrirlo sin problemas en herramientas de hojas de cálculo. Para integración web y uso de API, conviértelo a JSON. Para una visualización básica, extrae los tokens sin procesar a TXT. Arrastra y suelta tu archivo para analizarlo y convertirlo: gratis, en línea y sin instalar software en convert.guru.
Convert.Guru analiza su archivo VOCAB, detecta el formato exacto y le permite leer el texto que contiene.
Los usuarios también convirtieron archivos PB, TFR y LABELS.
Preguntas frecuentes
Si desea convertir un archivo VOCAB a CSV, JSON, XML, YAML, YML, TOML, INI, CFG, CONF, DAT, DB o SQL, puede utilizar SentencePiece o un software similar de la categoría "Almacenamiento de vocabulario de tokenizador NLP". En el menú Archivo, busque Guardar como… o Exportar….
Para convertir archivos DBF, XML, SQLITE, XLSX, SQL, TSV, ACCDB, YAML, MDB, CSV, ODS o JSON a VOCAB, pruebe SentencePiece u otra herramienta comparable de la categoría "Almacenamiento de vocabulario de tokenizador NLP".
Acerca del convertidor VOCAB
Convert.Guru se basa en una de las bases de datos de formatos de archivo más grandes y reconocidas, que se mantiene desde hace más de 25 años. Nuestro reconocimiento de formato identifica VOCAB de forma fiable — incluso si los archivos tienen un nombre incorrecto o están dañados — y los convierte a formatos comunes. El convertidor VOCAB funciona directamente en el navegador, sin registro ni instalación. Los archivos subidos se eliminan automáticamente después de la conversión.