dijous, de novembre 9

La informática al servicio de la didáctica de la lengua

Xavi Rosell me manda por correo este desopilante post que se publica en Microsiervos.

Datos irrelevantes sobre El Quijote

La primera parte de El ingenioso hidalgo don Quijote de la Mancha, por Miguel de Cervantes Saavedra, procesado por frecuencias de palabras a partir del original almacenado en modo texto en Proyecto Gutenberg, arroja estos resultados:

  • Contiene 211.560 palabras
  • De las cuales 15.781 son distintas
  • En total hay más de 800.000 letras y signos ortográficos
  • La palabra que es la más frecuente y aparece 10.611 veces (también hay 319 qué).
  • Le siguen, por este orden: de, y, la, a, en, el, no, se, los, con, por, su, lo, le, las, me, como y del. Después viene don que sería primera palabra menos común de las palabras comunes, aunque aparece 1.019 veces (el resto aparecen menos de mil veces).
  • Contiene 19.378 comas y 4.675 puntos.
  • La palabra Quijote aparece 839 veces; Sancho, 659 y Dulcinea, 88.
  • La primera palabra por orden alfabético es a y la última, zuzaban, superando a zurrón que es la penúltima.
Eyyyyy no penséis que me volví loca!!! ¡¡¡ES BROMAAA!!! Pero yo conozco a más de uno que creería que es una utilidad TIC al servicio de la lengua en el aula...
¡Ay, si hablara! ¡Dios me conserve la diplomacia!

Etiquetes de comentaris:

7 comentaris:

Blogger Eduardo Larequi ha dit...

Bueno, Bea, no son datos tan irrelevantes. Con análisis semejantes (pero mucho más complejos y sutiles), se han investigado temas muy debatidos en la historia de la literatura, como por ejemplo el famoso caso de la autoría del acto I de La Celestina.

Claro que para nuestro trabajo habitual no sirven de mucho, pero no carecen totalmente de utilidad.

10:52 p. m.  
Blogger Bea ha dit...

He dicho "de la didáctica de la lengua", no para usos filológicos -por ejemplo de tipo crítico o lexicográfico- donde este tipo de estudios computacionales han dado excelentes frutos.
Estoy hablando de las TIC en el aula.

11:07 p. m.  
Blogger Felipe Zayas ha dit...

No recuerdo dónde leí (quizá en alguno de los trabajos incluido en la edición de Francisco Rico) que la palabra más frecuente (exceptuando quizá las que no tienen morfema léxico) es "dijo". También "respondió" es una de las más usadas. Esto apoya la idea de que el Quijote se podría resumir como la historia de dos amigos que salen al campo a hablar de sus cosas (tampoco recuerdo la procedencia de esta broma que a mí me hace mucha gracia.)

11:21 p. m.  
Blogger Bea ha dit...

:-) imagínate la lingUística computacional al servicio de analizadors de discursos políticos (o didácticos !!!). Nos llevaríamos sorpresas. Hay estudios muy interesantes sobre el tema, aunque desde otros enfoques (Análisis pragmático del discurso docente, A. M. Manacorda, 1980).
Leí hace poco que se usará un analizador sintáctico para analizar la ideología del emisor (seguramente también para crear discursos...).
Un abrazo.

8:16 a. m.  
Blogger Eduardo Larequi ha dit...

Vuelvo sobre lo dicho: "no carecen totalmente de utilidad", y cito un ejemplo de uso: la descripción de algunas características textuales.

Yo he mostrado alguna vez a los alumnos las diferencias entre distintos tipos de textos, a partir de los recuentos estadísticos que generan los procesadores de textos (Word y, sobre todo, WordPerfect).

No es un terreno en el que haya profundizado mucho, pero por lo que conozco de alguna de las tecnologías que se están desarrollando (y a las que tú misma te refieres en el último comentario), es posible que dentro de algunos años los procesadores de texto nos proporcionen herramientas que ahora mismo casi no podemos ni imaginar.

Si me lo permitís, os recomiendo un libro fascinante, al que de vez en cuando le echo un vistazo (porque, francamente, hay capítulos en que me pierdo): Julia Lavid, Lenguaje y nuevas tecnologías. Nuevas perspectivas, métodos y herramientas para el lingüista del siglo XXI, Madrid, Cátedra, 2005.

8:34 a. m.  
Blogger Bea ha dit...

Gracias, Eduardo, por introducir en este blog una conversación con algo de "tono muscular". Soy una persona vital y polemista en presencia, pero ciertamente poco provocativa en mi ciberpersonalidad. Estoy contenta de haber agregado en rojo un punto que da para compartir contigo este amable intercambio de opiniones.
Suscribo en su totalidad tu afirmación "no carecen totalmente de utilidad". Aun y así, pensando para rebatir, me encontré razonando para compartir utilidades en el aula de comentarios derivados de datos cuantitativos que nos facilitan herramientas digitales.

- descripción de algunas características textuales.
- Con la Opción=>edita>buscar, observa la frecuencia de aparición de la palabra campana y sus derivados léxicos en el Monte de las Ánimas, de Bécquer. ¿En qué sentido contribuyen al clima de misterio?.

Pero te confieso que, fuera de casos puntuales de observación y reflexión de aspectos lingüísticos, (que justifican nuestro "no carecen totalmente") no encuentro que sea un aspecto de las TIC que otorgue un "plus" a la enseñanza de la lengua en la ESO. Valoro en cambio, estas herramientas para el uso de los lingüistas.

No obstante, es la acción mediadora del profe la que otorga magia a toda herramienta... y en este punto se acabaron las palabras.

10:38 a. m.  
Anonymous Anònim ha dit...

Mirad esto:

http://minushu.blogspot.com/2006/11/
dime-de-qu-hablas-y-te-dir-qu.html

"El programa creado por Chirag Mehta, programador, entre otras muchas cosas, analiza los discursos de los presidentes norteamericanos desde 1776 hasta la actualidad. Una nube de etiquetas muestra "la popularidad, frecuencia y tendencias en el uso de las palabras", según explica en su web."

Me lo ha recordado algo que ha comentado Bea.

9:17 p. m.  

Publica un comentari a l'entrada

Subscriure's a Comentaris del missatge [Atom]

<< Pàgina d'inici