TSV (Valores separados por tabulaciones)
TSV es un formato de texto plano para datos tabulares que usa tabulaciones como separador de campos en lugar de comas. Esto simplifica el análisis, ya que las tabulaciones raramente aparecen en los valores de los datos, eliminando la mayoría de problemas de entrecomillado.
Tipo MIME
text/tab-separated-values
Tipo
Texto
Compresión
Sin pérdida
Ventajas
- + Simpler parsing than CSV — no quoting rules needed
- + Tabs rarely appear in data, reducing ambiguity
- + Standard in bioinformatics and scientific data pipelines
Desventajas
- − Less universally recognized than CSV in business tools
- − Cannot represent values containing tab characters
- − Some spreadsheet tools default to CSV, not TSV
Cuándo usar .TSV
Usa TSV cuando los valores de tus datos contengan comas pero no tabulaciones, o al trabajar con herramientas Unix (cut, awk) que manejan bien la separación por tabulaciones.
Detalles técnicos
Los archivos TSV usan U+0009 (tabulación horizontal) como separador de campos y saltos de línea como separadores de registros. A diferencia de CSV, TSV no tiene un mecanismo estándar de entrecomillado; los campos no deben contener tabulaciones ni saltos de línea.
Historia
Los formatos separados por tabulaciones han sido utilizados en sistemas Unix y herramientas de procesamiento de datos durante décadas. IANA registró el tipo MIME text/tab-separated-values. TSV se mantiene popular en bioinformática, lingüística y exportaciones de hojas de cálculo.