¿Hay palabras que repites demasiado en tus textos?-5-Pasos finales en Excel

Photo by Jon Ottosson
Ya hemos completado el viaje, al menos el informático, y recogido los frutos de nuestro esfuerzo: contamos con un fichero en Excel con una lista con la posición de cada palabra de nuestro escrito; lista en la que se han resaltado los casos en los que dos palabras iguales están "demasiado" próximas entre sí, según nuestro criterio.

Recordemos que este valioso fichero Excel, es el resultado de seguir los pasos que hemos seguido en los cuatro artículos anteriores (1, 2, 3 y 4). Si no lo has hecho ya, te recomiendo que los leas antes de continuar.

Si todo ha ido bien, las primeras líneas de la pestaña "TOTAL" del fichero Excel deberían tener un aspecto semejante al de esta imagen (el texto base que he utilizado es el contenido íntegro de mi último artículo en este blog: "Reseña de «Vicio propio», novela de Thomas Pynchon"):



Vayamos paso a paso.

En el recuadro superior izquierdo aparecen los parámetros que ajustarán los cálculos de acuerdo con nuestras preferencias. Por defecto, el programa supone que el texto analizado se compone de 200 páginas y que queremos que nos avise cuando entre dos palabras repetidas disten entre sí menos de 50 palabras. Estos dos aspectos están resultados en amarillo en el recuadro citado y puedes/debes modificarlos a tu conveniencia. Las otras dos cifras no tenemos que manipularlas ya que las calcula el propio programa: el número total de palabras del escrito y el número medio de palabras por página. Una pequeña observación: el número de palabras que se indica en el ejemplo (842) es diferente del que resultó del conteo de Word (722). Es correcto. ¿Recordáis que al programa le dijimos que no incluyera determinadas palabras (artículos, por ejemplo)? Por otra parte, el programa sí incluye los espacios, al contrario que Word. En cualquier caso, no importa el valor absoluto de la cifra, lo relevante es la posición relativa de cada palabra respecto de las demás, y eso lo tenemos.

Entendido lo anterior, toca modificar los dos parámetros en amarillo. Dejo que la distancia para el aviso de palabras repetidas sea 50 (se corresponde con un párrafo mediano, pero podéis cambiarla como prefiráis: cuanto menor sea el número, menos palabras nos aparecerán resaltadas dado que menos palabras cumplirán el requisito de cercanía) y modifico el número de páginas de 200 a 3, que viene a ser la longitud que tenía el fichero de Word donde escribí el texto del artículo. En realidad, no os preocupéis demasiado por este último número ya que sólo se utiliza para indicar la página "aproximada" en la que está cada palabra; solo se trata de una orientación para la búsqueda.

Tras la modificación anterior, la lista anterior ha quedado así:



Comencemos a revisar las líneas con las palabras de mi artículo. Aparecen ordenadas primero alfabéticamente y, cuando se repite una palabra, por el número de posición de la palabra. Creo que lo mejor es explicarlo sobre el caso real que he presentado:


  • Línea 5, palabra "abusar": se encuentra en la posición 524 y en la página “aproximada” número 2. La línea 6 indica otra palabra lo que quiere decir que "abusar" no se repite ni una sola vez.
  • Línea 6, palabra "acababa": posición 388 y en la página número 1. Tampoco se repite.
  • Líneas 7 y 8: igual argumento que en los casos anteriores.
  • Línea 9, palabra "aceptarla": además de indicar su posición y el número de página en que se encuentra, aparece el número 265 en la columna "diff nº pal." Quiere decir que 265 palabras antes se encontró una repetición de la palabra "aceptarla". Efectivamente, si nos fijamos en la línea 8, la palabra "aceptarla" ya aparecía en la posición 244 de la página número 1. Como 265 son más palabras que las 50 que le indicamos para que nos avisara, el programa no la ha resaltado en rojo: están "demasiado" separadas entre sí como para preocuparme :)
  • Líneas 10 a 18: no hay palabras repetidas
  • Línea 19, palabra "algunas": posición 373 de la página número 1 y "difª nº al" con un 13, esta vez resaltado en rojo. Es decir, esta palabra "algunas" es una repetición de otra que escribí 13 palabras antes, como se puede comprobar en la línea 18, donde aparece en la posición 360. Esta es una señal de alerta en toda regla y deberíamos analizarla para decidir si cambiamos o no alguna de las dos palabras repetidas. (Me temo que el programa tiene razón y debería haberla cambiado :( )
  • Líneas 20 a 24: no hay palabras repetidas o están muy distanciadas entre sí.


El listado continúa hasta la línea 393, pero los criterios de actuación hasta llegar a ella son semejantes a los ya comentados. De esta forma, tendríamos identificadas en rojo aquellas palabras sobre las que tenemos que reflexionar sobre nuestro texto. "Solo" nos quedaría decidir si queremos dejarlas como están o modificar la palabra o la frase en la que se encuentra.

En el siguiente y, espero, último artículo de la serie recapitularé todo el procedimiento seguido. Intentaré utilizar un ejemplo práctico desde el comienzo hasta las revisiones finales en Word. Veréis que los pasos técnico-informáticos nos llevarán pocos minutos mientras que las revisiones en Word acapararán casi todo el tiempo, eso sí estarán bien dirigidas.

Como siempre, estaré encantado de escuchar tus comentarios y/o recomendaciones.

Si te ha gustado este artículo no te cortes y recomiéndalo en las redes sociales.

No hay comentarios:

Publicar un comentario

Redes sociales