Mostrando entradas con la etiqueta lenguaje. Mostrar todas las entradas
Mostrando entradas con la etiqueta lenguaje. Mostrar todas las entradas

miércoles, 24 de enero de 2018

Redes de comercio influyeron en el nombre del té

si por mar, cha si por tierra: ¿Por qué el mundo solo tiene dos palabras para té?



Nikhil Sonnad || Quartz

Con algunas excepciones menores, en realidad solo hay dos formas de decir "té" en el mundo. Uno es como el término inglés-té en español y el tee en afrikaans son dos ejemplos. La otra es una variación de cha, como chay en hindi.

Ambas versiones provienen de China. Cómo se extendieron por el mundo ofrece una imagen clara de cómo funcionaba la globalización antes de que la "globalización" fuera un término que cualquiera usara. Las palabras que suenan como "cha" se extienden por la tierra, a lo largo de la Ruta de la Seda. Las frases del tipo "té" se extienden sobre el agua, por los comerciantes holandeses que traen la novela a Europa.





El término cha (茶) es "sinítico", lo que significa que es común para muchas variedades de chino. Comenzó en China y se abrió paso a través de Asia central, llegando a ser "chay" (چای) en persa. Eso sin duda se debe a las rutas comerciales de la Ruta de la Seda, a lo largo de las cuales, según un descubrimiento reciente, el té se comercializó hace más de 2.000 años. Esta forma se extendió más allá de Persia, convirtiéndose en chay en urdu, shay en árabe y chay en ruso, entre otros. Incluso llegó al África subsahariana, donde se convirtió en chai en swahili. Los términos japonés y coreano para el té también se basan en el cha chino, aunque esos lenguajes probablemente adoptaron la palabra incluso antes de su difusión hacia el oeste en persa.

Pero eso no explica el "té". El carácter chino para el té, 茶, se pronuncia de manera diferente por diferentes variedades de chino, aunque está escrito igual en todas ellas. En el mandarín de hoy, es chá. Pero en la variedad de chino Min Nan, que se habla en la provincia costera de Fujian, el personaje se pronuncia te. La palabra clave aquí es "costera".

La forma te utilizada en las lenguas costeras chinas se extendió a Europa a través de los holandeses, que se convirtieron en los principales comerciantes de té entre Europa y Asia en el siglo XVII, como se explica en el Atlas mundial de estructuras lingüísticas. Los principales puertos holandeses en el este de Asia se encontraban en Fujian y Taiwán, ambos lugares donde las personas usaban la pronunciación te. La importación de té expansiva de la Compañía Holandesa de las Indias Orientales a Europa nos dio el thé francés, el Tee alemán y el tea inglés.

Sin embargo, los holandeses no fueron los primeros en Asia. Ese honor pertenece a los portugueses, que son responsables del nombre europeo colonial de la isla de Taiwán, Formosa. Y los portugueses comerciaron no a través de Fujian, sino de Macao, donde se usa chá. Por eso, en el mapa de arriba, Portugal es un punto rosa en un mar de azul.

Algunos idiomas tienen su propia forma de hablar sobre el té. En general, estos idiomas se encuentran en lugares donde el té crece naturalmente, lo que llevó a los lugareños a desarrollar su propia forma de referirse a él. En birmano, por ejemplo, las hojas de té son lakphak.

El mapa muestra dos épocas diferentes de la globalización en acción: la milenaria extensión terrestre de bienes e ideas hacia el oeste desde la China antigua y la influencia de la cultura asiática de 400 años sobre los europeos marineros de la era de la exploración. Además, acabas de aprender una nueva palabra en casi todos los idiomas del planeta.

martes, 21 de julio de 2015

Redes de lenguaje en redes sociales

Cuando más grande no es mejor
Por R.L.G. | Berlin - The Economist


¿Cómo calificaría usted a las lenguas "importantes"? Si se le pregunta los ordene, muchas personas comienzan con Inglés, pero después de eso son reacios a ir más allá. Cuán importante, se preguntan. Un enfoque sería mirar a la gente y el dinero: sin duda una lengua es importante si se habla de un montón de gente, en los países con gran riqueza (y es de suponer, por lo tanto, poder).

Pero en diciembre llegó un nuevo enfoque. Un grupo de estudiosos * acercó a la tarea por primera mirando cómo las lenguas se conectan entre sí, en lugar de verlas de forma aislada. Entonces decidieron ver si esto era un buen predictor de la cantidad de gente famosa hablaban una lengua dada. Si una lengua está bien conectado con los demás (un lenguaje de "hub" con muchos bilingües), sus hablantes tienden a ser famosa. Y los nombres de los idiomas conectados resultan ser bastante interesante.

Para encontrar vínculos entre las lenguas, los investigadores crearon una "red global de lenguaje" (GLN) de tres maneras diferentes (véase el gráfico). Uno era editores de Wikipedia: un wikipedista bilingüe que edita artículos en árabe y en Inglés que cuenta como el fortalecimiento de los lazos entre el árabe y el Inglés. El segundo era Twitter: usuarios que habían twitteado al menos seis frases completas en un segundo idioma se trataron como fortalecer el vínculo entre esos dos idiomas. El tercero era un, más formal métrica antigua: traducción libro. La UNESCO, la organización cultural de las Naciones Unidas, mantiene una base de datos de libros traducidos, y cada uno de los 2,2 millones de traducciones se contó como un bono fortalecimiento de los dos idiomas. (Estos bonos, por supuesto, son asimétricos: algunas lenguas tienen más libros traducidos de ellos que a ellos y viceversa.)




Las redes resultantes son notables en muchos aspectos. Inglés es fundamental para todos ellos. Pero con muchos otros idiomas, su conectividad tiene poco que ver con el poder moderno de su país de origen. Tome la red implica libro-traducción. Los datos provienen de 1979-2011, por lo que Rusia es un nodo importante en la red. No sólo se tradujeron libros entre ruso y otros idiomas de la antigua Unión Soviética (Armenia, kirguís y el letón, dicen), pero el ruso se conecta de manera significativa a las lenguas del sur y el sudeste de Asia y el Medio Oriente. El contraste con Wikipedia y Twitter, que sesgar mucho más moderno, es sorprendente: ruso repente se convierte en un nodo periférico.

China, también, es periférica en las redes de los autores. En la red de libro-traducción, el idioma más hablado del mundo está aislado, conectado principalmente a otras lenguas chinas más unos pocos en el sudeste de Asia, en particular vietnamitas. Esto puede tener sentido dado el marco temporal de la base de datos de libros de traducción, sesgado a décadas antes espectacular ascenso de China. Pero China también es un jugador poco en Twitter, como resultado de la popularidad de Sina Weibo, un servicio similar a Twitter competir, en China. Lo mismo puede decirse de la Wikipedia: aquí china está mejor conectado un poco, pero todavía es mucho menor que su tamaño o el PIB podría predecir, posiblemente gracias a la existencia de una Wikipedia-como Baidu Baike enciclopedia colaborativa.

La conclusión es clara: las grandes lenguas no son necesariamente global, y viceversa. El árabe y el hindi-dos otros idiomas con cientos de millones de hablantes son los periféricos como el chino y el ruso. Los grandes nodos en las redes, además de Inglés son predecibles: francés, español y alemán, sobre todo. Los dos primeros fueron arrojados con éxito a lo largo y ancho por el colonialismo. Alemán tiene siglos de prestigio en la ciencia, la filosofía y la literatura, a pesar de los fracasos de los esfuerzos coloniales de Alemania.

Sin embargo, estos resultados deben ser manejados con cuidado, señalan los autores. El documento no dice nada acerca de las cualidades inherentes de cualquier lengua, o la astucia de sus hablantes. César Hidalgo, uno de los autores, señala que el artículo es realmente acerca de las élites. Los bilingües con tiempo para editar la Wikipedia no son personas normales, ni son los traductores de libros (o incluso los usuarios bilingües de Twitter). Pero lo hacen jugar un papel desmesurado en la transmisión de la cultura a través de fronteras. El principal hallazgo del estudio es que las personas son más propensos a convertirse en mundialmente famosa (medida, en parte, en las personas con las entradas de Wikipedia en al menos 25 idiomas) si hablan uno de los idiomas más en red. Persona más brillante del mundo puede ser un representante de la etnia hmong o náhuatl, pero el camino a la fama conduce a través de otros idiomas.

Hay una naturaleza "¿qué más se puede esperar?" Para el papel descomunal de las lenguas occidentales en tres productos occidentales nacido: la industria del libro-publicación masiva, Wikipedia y Twitter. Pero los resultados siguen siendo significativa: Twitter es de importancia mundial realmente (sólo pide a los mulás iraníes o el ex presidente de Túnez). Sina Weibo y VK (de Rusia Facebook) no lo son. Su naturaleza hecha en casa puede ser un motivo de orgullo, sin duda mantiene censores feliz, pero también significa reducir la influencia cultural de un país.

Para el estudiante de idiomas, la naturaleza en red de las lenguas plantea un dilema interesante: en caso de que aprender un lenguaje popular entre las élites globales? La tradición de aprendizaje del francés todavía se ve como una buena apuesta aquí. ¿O hay que aprender un idioma cuyo número de bilingües trotamundos es pequeño en relación a su importancia? La oferta y la demanda dice que esto será valioso. Este es el caso real para aprender chino: no porque es el idioma mundial en aumento, pero debido a que no-es-al menos por cierto todavía no. Dada enorme papel de China en la economía mundial, el número de extranjeros con fluidez en chino es todavía demasiado pocos.

"Links que hablan: La red de idioma global y su asociación con la fama mundial," por Shahar Ronen, Bruno Gonçalves, Kevin Z. Hu, Allesandro Vespignani, Steven Pinker y César Hidalgo, Actas de la Academia Nacional de Ciencias, diciembre 2014

martes, 16 de diciembre de 2014

Redes de difusión por idioma


Muchos libros están traducidos dentro y fuera de idiomas Comentarios tales como Inglés, alemán y ruso, árabe, pero tiene menos traslaciones relativas a sus múltiples altavoces. (Las flechas entre círculos representan traducciones; el tamaño del círculo de una lengua es proporcional a la cantidad de personas que lo hablan.)

¿Quieres influir en el mundo? Mapa revela los mejores lenguajes para hablar

Por Michael Erard - Science Magazine


Hable o escriba en Inglés, y el mundo lo va a escuchar. Hable o escriba en Tamil o portugués, y usted puede tener más dificultades para hacer llegar su mensaje. Ahora, un nuevo método para la cartografía de cómo fluye la información en todo el mundo Identifica los mejores lenguajes de difundir sus ideas a lo largo y ancho. Un consejo: Si usted está pensando en una segunda lengua, intente español en lugar del chino.

El estudio fue impulsado por una conversación acerca de un libro no traducida, dice Shahar Ronen, un administrador de programas Microsoft quién Massachusetts Institute of Technology (MIT) tesis de maestría fue la base de la nueva obra. A bilingües altavoces Hebreo-Inglés de Israel, de la cifra de su asesor MIT, César Hidalgo (sí un altavoces español-inglés), sobre un libro escrito en hebreo quién la traducción en Inglés de la que aún no era consciente. "Tuve la oportunidad de cubrir un espacio de cierta cultura Porque yo era multilingüe", afirma Ronen. Empezó a pensar acerca de cómo crear un mapas de todo el mundo de cómo las personas multilingües transmiten información e ideas.

Ronen y co-autores del MIT, la Universidad de Harvard, la Universidad del Noreste y Universidad de Aix-Marsella abordar el problema mediante la descripción de las tres redes globales basadas en tweeters bilingües de idiomas, traducciones de libros y ediciones de Wikipedia multilingües. El libro traza la traducción de la red cuántos libros han sido traducidos a otros idiomas. Por ejemplo, el libro hebreo, traducido del hebreo al Inglés y alemán, estaría representada en líneas apuntando desde un nodo del hebreo a los nodos de Inglés y Alemán. Esa red se basa en 2,2 millones de traducciones de libros impresos publicados en más de 1.000 lenguas. Como en todas las redes, el espesor de las líneas representa el número de conexiones entre nodos. Para tweets, los investigadores utilizaron 550 millones de tweets por 17 millones de usuarios en 73 idiomas. En esa red, si un usuario tweets en, digamos, el hindi, así como en Inglés, los dos idiomas están conectados. Para construir la red Wikipedia, los investigadores siguieron ediciones en hasta cinco idiomas realizados por los editores, se excluyen cuidadosamente bots.

En las tres redes, Inglés tiene la mayoría de las transmisiones desde y hacia otras lenguas y es el centro más céntrico, informó el equipo en línea hoy en las Actas de la Academia Nacional de Ciencias. Pero los mapas revelan también "un halo de centros intermedios," De acuerdo con el documento, comentarios como el francés, alemán y ruso, la que sirven la misma función en una escala diferente.

Por el contrario, algunas lenguas con grandes poblaciones de altavoces, Comentarios como el mandarín, el hindi y árabe, se encuentran en estas redes son relativamente aislado. Esto significa que un menor número de comunicaciones en Comentarios esos idiomas alcanzan los hablantes de otras lenguas. Mientras tanto, un idioma como el holandés hablado por 27 millones de personas, puede ser una parte desproporcionadamente grande de conducto, en comparación con un idioma como el árabe, el cual cuenta con la friolera de 530 millones de hablantes de lengua materna y segunda. Esto es porque los holandeses son muy multilingüe y muy en línea.

  Los mapas de la red muestran lo que ya se sabe, la confirmación instantánea: Si usted desea conseguir sus ideas a cabo, se puede llegar a una gran cantidad de personas a través del idioma Inglés. Sin embargo, los mapas muestran cómo los hablantes También en idiomas dispares benefician de ser indirectamente vinculados a través de lenguas grandes y pequeños cubos. En Twitter, por ejemplo, las ideas en Filipino pueden teóricamente se mueven a la esfera de habla coreana a través malayo, mientras que el camino más probable para las ideas para ir de turco para malayalam (hablado en la India por 35 millones de personas) es a través de Inglés. Comentarios Estas redes se revelan en detalle en la página web del estudio.

Los autores señalan que los usuarios que estudiaron, a quienes consideran elite Porque, a diferencia de la mayoría de la gente en el mundo que saben leer y escribir y en línea, no representan a todos los hablantes de una lengua. Sin embargo, "las élites de idiomas globales tienen una cantidad desproporcionada de poder y responsabilidad, Debido a que están dando forma tácita la forma en la que las culturas distantes ver otra llamada ahora, incluso si ésta no es su objetivo", dice Hidalgo. Cuando el conflicto en Ucrania estalló el verano pasado, la mayoría de personas en el mundo conocieron a través de nuevas historias escritas originalmente en Inglés y luego traducidas a otros idiomas. En este caso, "sesgos implícitos o ángulo tomada por los medios ingleses aportan color a la información sobre el conflicto que está disponible para muchas personas que no hablan inglés", dice Hidalgo.

Las redes ofrecen potencialmente orientación a los gobiernos y otras comunidades lingüísticas que quieren cambiar Críticas su papel internacional. "Si yo quiero que mi lengua nacional sea más prominente, entonces yo debería invertir más en la traducción de documentos, alentar a más gente a twittear en Reviews su idioma nacional", afirma Ronen. "Por otro lado, si quiero nuestras ideas a difundir, debemos elegir una segunda lengua que está muy bien conectado."

Para quienes no hablan inglés, la elección del Inglés como segunda o tercera lengua es obvia. Para personas de habla inglesa, el análisis sugiere que sería más ventajoso elegir españoles sobre China, al menos si están extendiendo Comentarios sus ideas a través de la escritura.

El problema de medir la situación relativa de las lenguas del mundo "es muy difícil, ya menudo muy difícil conseguir buenos datos está a punto", dice Mark Davis, presidente y co-fundador del Consorcio Unicode en Mountain View, California, roomates hace la codificación de caracteres para las computadoras del mundo y dispositivos móviles. "Su punto de vista sobre el problema es interesante y útil."

La transmisión cultural que ocurre en el lenguaje hablado demasiado, señala William Rivers, el director ejecutivo del Comité Nacional Conjunto sin fines de lucro para las Lenguas y el Consejo Nacional de Lenguas y Estudios Internacionales en Garrett Park, Maryland. Los datos sobre las interacciones en, digamos, los zocos de Marrakech, donde se habla árabe, Hassaniya, el árabe marroquí, francesa, Tashelhit y otros idiomas, son imposibles de conseguir, pero importante en la transmisión cultural, dice. Y agrega que "a medida que Internet se ha vuelto más accesible a más personas en todo el mundo, se conectan a Internet en Reviews su propio idioma." Cuando lo hacen, ahora saben cómo conectarse a otros idiomas y se mueve Comentarios sus ideas también.


viernes, 18 de julio de 2014

Curso rápido del lenguaje de Twitter

Un curso rápido en el lenguaje de Twitter




Si recuerdas estar un poco desconcertado por Twitter la primera vez que lo intentaste, no estás solo. Es desconcertante. 
A veces, se puede entender todo lo que en un tweet, como éste:
Pero otros tuits están llenos de códigos, taquigrafía y formato raro - que nadie se molesta en explicar. 
Hasta hoy.
Antes de sumergirse en, sin embargo, debemos recordar que un tweet no puede contener más de 140 caracteres de longitud. (¿Por qué? Porque en la concepción original de Twitter, los tweets estaban destinados a llegar a los teléfonos móviles como mensajes de texto, y los que se limitan a 160 caracteres. Los inventores de Twitter reservaron 20 caracteres para el nombre del miembro de Twitter.)
Esta limitación obliga a la gente a ser conciso, ser creativos - y, a veces, para desarrollar estas convenciones complejas. 
Supongamos, por ejemplo, que se ve un tweet como éste:
Esto solo tweet contiene cuatro ejemplos de convenciones de Twitter:
• @SFGate. El símbolo @ indica el nombre de un miembro de Twitter. Yo soy @pogue, por ejemplo. Este tweet también menciona a Elon Musk, el CEO de Tesla Motors. Su nombre de Twitter es, por supuesto, @elonmusk.
• RT @SFGate. RT es por retweet. Por lo que Debbie aquí está repitiendo (esto es, retwiteando) el tweet de alguien — en este caso, ella está retwiteando algo que dicho por @SFGate. (SFGate es una rama online del San Francisco Chronicle.)
La gente usa el RT como una cortesía; le da crédito al autor original.
• sfg.l/1t4EIEd. Esto es una URL — un enlace a una página web. Los URLs son super comunes en los tweets, dado que un uso clave de Twitter es compartir cosas encontradas en la red. Aquí si usted cliquea en el enlace, iría al artículo de SFGate que está siendo citado aquí.
¿Y por qué no se ve como una dirección Web normal? Las direcciones web son a menudo más largas, se comen su asignación de caracteres de Twitter. Así que la gente utiliza los servicios de acortamiento de enlace como bit.ly y goo.gl (sí, esas son las direcciones web, también). En estos sitios, se pega en su dirección de longitud, y se obtiene una mucho más corta (que apunta al mismo lugar) para utilizar en Twitter. 
Twitter también acorta vincula a sí mismos (que comienzan con "t.co /"), pero es probable que no vea que, desde el sitio web de Twitter muestra vínculos originales.
• #Tesla. El numeral # es un hashtag. Es una etiqueta para tu tweet. Otra gente puede buscar estos hashtags — o cliquearlos — para ver más tweets sobre el mismo sujeto. Si cliqueas  “#Tesla,” verás una lista entera de tweets, todos relativos a la compañía Tesla y sis autos. (También se puede ir a Twitter.com y tipear el hashtag en la caja de búsqueda.)
Eso, al menos, esa sería la función de los hashtags. 
Hoy en día, sin embargo, la gente agrega hashtags sarcásticamente, como comentarios sobre sus propios tweets. Alguien podría twitear, por ejemplo, "La mujer demanda a restaurante para servir a su demasiado grande una porción de lasaña. #killmenow ". 
Lo que quiere decir: "Oh, Dios mío, yo no quiero vivir en una sociedad donde esto puede suceder; mátame ahora (killmenow)". 
Muy bien, entonces: Ahora se puede armar lo que está sucediendo en este tweet:
En un artículo de SFGate, el fundador de Tesla Motors, Elon Musk anunció que va a haber un nuevo coche de Tesla, llamado el Modelo 3. El miembro de Twitter Debbie Duncan le pasa un enlace al artículo a sus seguidores (RT), añadiendo el hashtag #Tesla para contexto y capacidad de búsqueda. Y añadió su propio comentario a la noticia de última hora, diciendo: "Mi próximo auto!" 
¿Lo entiendes? 
Ahora, aquí está un curso avanzado:
Este tweet contiene muchos de los mismos elementos; de nuevo, es un comentario en un artículo. En este caso, usted está viendo la MT abreviatura menos común, es decir, "tweet modificado." No había espacio para incluir a todo el título (originalmente twitteado por @BrandonMSellers), por lo que Bill Hewson acortó y admitió hacerlo. 
(También es posible que encuentre la abreviatura HT. Es sinónimo de "hat-tip", lo que significa que está dando las gracias a alguien por una idea que se convirtió en su tweet.) 
Luego viene el enlace al artículo, y una muy útil nota "via" de que el artículo proviene de la Harvard Business Review. (Es, también, tiene una cuenta de Twitter - @ HarvardBiz.) 
Y ahora usted está listo para entender el diálogo hirviente que es Twitter, y tal vez incluso el uso de algunos de estas convenciones.
Adelante y a twitear!
You can email David Pogue here.



viernes, 11 de octubre de 2013

Los textos de Facebook definen personalidades y lenguajes

Scientists Used Facebook For The Largest Ever Study Of Language And Personality — And The Results Are Groundbreaking


A group of University of Pennsylvania researchers who analyzed Facebook status updates of 75,000 volunteers have found an entirely different way to analyze human personality, according to a new study published in PLOS One.

The volunteers completed a common personality questionnaire through a Facebook application and made their Facebook status updates available so that researchers could find linguistic patterns in their posts.

Drawing from more than 700 million words, phrases, and topics, the researchers built computer models that predicted the individuals’ age, gender, and their responses on the personality questionnaires with surprising accuracy.

The “open-vocabulary approach” of analyzing all words was shown to be equally predictive (and in some cases moreso) than traditional methods used by psychologists, such as self-reported surveys and questionnaires, that use a predetermined set of words to analyze.

Basically, it's big data meets psychology.

The Penn researchers also created word clouds that “provide an unprecedented window into the psychological world of people with a given trait,” graduate student Johannes Eichstaedt, who worked on the project, said in a press release. “Many things seem obvious after the fact and each item makes sense, but would you have thought of them all, or even most of them?”

Here are some personality traits (key at bottom):





PLOS One





The word clouds allowed the researchers to generate new insights into relationships between traits and language used.

For example, participants with the most emotional stability refer to sports much more.

Researcher Lyle Ungar said this suggests “we should explore the possibility that neurotic individuals would become more emotionally stable if they played more sports.”

In this way the results provide new ways of researching connections between traits, behaviors, and the effectiveness of psychological interventions.

Here's the breakdown by age:








PLOS One





Martin Seligman, director of the Positive Psychology Center, explained why the new approach trumps previous methods: “When I ask myself, ‘What's it like to be an extrovert?’ ‘What's it like to be a teenage girl?’ ‘What's it like to be schizophrenic or neurotic?’ or ‘What's it like to be 70 years old?’ these word clouds come much closer to the heart of the matter than do all the questionnaires in existence.”

Here is gender:




PLOS One

The biggest boon of the study may be that instead of asking millions of people to fill out surveys, future studies could involve volunteers submitting their Facebook or Twitter feeds for anonymized study.

“Researchers have studied these personality traits for many decades theoretically,” Eichstaedt said, “but now they have a simple window into how they shape modern lives in the age of Facebook.”

The study is part of the World Well-Being Project, which has found several ways to “analyze the big data available through online social media in light of psychological theory.”



Business Insider