sábado, 16 de marzo de 2019

SEMÁNTICA


La categorización es el proceso por el cual las ideas y los objetos se reconocen, se diferencian y se comprenden. [1] Lacategorización implica que los objetos se agrupan en categorías, generalmente con algún propósito específico. Lo ideal es que una categoría ilumine una relación entre los sujetos y los objetos de conocimiento. La categorización es fundamental en el lenguaje, la predicción, la inferencia , la toma de decisiones y en todo tipo de interacción ambiental. Se indica que la categorización juega un papel importante en la programación de computadoras . [2]
Hay muchas teorías y técnicas de categorización. Sin embargo, en una visión histórica más amplia, se pueden identificar tres enfoques generales para la categorización:
  • Categorizacion clasica
  • Agrupamiento conceptual
  • Teoria del prototipo


La vista clásica editar ]

La categorización clásica aparece por primera vez en el contexto de la filosofía occidental en el trabajo de Platón , quien, en su diálogo de estadista , presenta el enfoque de agrupar objetos en función de sus propiedades similares Aristóteles exploró y sistematizó aún más este enfoque en su tratado de Categorías , donde analiza las diferencias entre clases y objetos.Aristóteles también aplicó de manera intensiva el esquema de categorización clásico en su enfoque de la clasificación de los seres vivos (que utiliza la técnica de aplicar sucesivas preguntas de estrechamiento como "¿Es un animal o un vegetal?", "¿Cuántos pies tiene?", " ¿Tiene pelo o plumas? "," ¿Puede volar? "...), estableciendo así la base de la taxonomía natural .
La visión aristotélica clásica afirma que las categorías son entidades discretas caracterizadas por un conjunto de propiedades que comparten sus miembros. En la filosofía analítica , se supone que estas propiedades establecen las condiciones que son necesarias y suficientes para captar el significado.
De acuerdo con la visión clásica, las categorías deben estar claramente definidas, mutuamente excluyentes y colectivamente exhaustivas. De esta manera, cualquier entidad del universo de clasificación dado pertenece inequívocamente a una y solo una de las categorías propuestas.

Agrupamiento conceptual editar ]

La agrupación conceptual es una variación moderna del enfoque clásico, y se deriva de los intentos de explicar cómo se representa el conocimiento. En este enfoque, las clases (clústeres o entidades) se generan al formular primero sus descripciones conceptuales y luego clasificar las entidades según las descripciones.
El agrupamiento conceptual se desarrolló principalmente durante la década de 1980, como un paradigma de máquina para el aprendizaje no supervisado . Se distingue de la agrupación de datos ordinaria al generar una descripción del concepto para cada categoría generada.
Las tareas de categorización en las que las etiquetas de categoría se proporcionan al alumno para ciertos objetos se denominan clasificación supervisada , aprendizaje supervisado o aprendizaje de conceptos . Las tareas de categorización en las que no se suministran etiquetas se denominan clasificación no supervisada , aprendizaje no supervisado o agrupación de datos . La tarea de clasificación supervisada consiste en extraer información de los ejemplos etiquetados que permite una predicción precisa de las etiquetas de clase de los ejemplos futuros. Esto puede implicar la abstracción de una regla o concepto que relaciona las características del objeto observado con las etiquetas de categoría, o puede que no implique abstracción (por ejemplo, modelos ejemplares).). La tarea de agrupamiento consiste en reconocer la estructura inherente en un conjunto de datos y agrupar objetos por similitud en clases. Es así un proceso de generación de una estructura de clasificación.
El agrupamiento conceptual está estrechamente relacionado con la teoría de conjuntos difusos , en la que los objetos pueden pertenecer a uno o más grupos, en diversos grados de aptitud.

Teoría del prototipo editar ]

Desde la investigación realizada por Eleanor Rosch y George Lakoff en la década de 1970, la categorización también se puede ver como el proceso de agrupación de cosas basada en prototipos: la idea de condiciones necesarias y suficientes casi nunca se cumple en categorías de cosas que ocurren naturalmente. También se ha sugerido que la categorización basada en prototipos es la base para el desarrollo humano, y que este aprendizaje se basa en aprender sobre el mundo a través de la encarnación .
Un enfoque cognitivo acepta que las categorías naturales están clasificadas (tienden a estar borrosas en sus límites) e inconsistentes en el estado de sus miembros constituyentes.
Los sistemas de categorías no están objetivamente "ahí fuera" en el mundo, sino que están arraigados en la experiencia de las personas. Las categorías conceptuales no son idénticas para diferentes culturas o, de hecho, para cada individuo en la misma cultura.
Las categorías forman parte de una estructura jerárquica cuando se aplican a temas tales como la taxonomía en la clasificación biológica : nivel superior: nivel de forma de vida, nivel medio: nivel genérico o género , y nivel inferior: nivel de especie . Estos pueden distinguirse por ciertos rasgos que ponen un artículo en su categoría distintiva. Pero incluso estos pueden ser arbitrarios y están sujetos a revisión.
Las categorías en el nivel medio son perceptivas y conceptualmente las más destacadas. El nivel genérico de una categoría tiende a provocar la mayoría de las respuestas y las imágenes más ricas, y parece ser el nivel psicológicamente básico. Las taxonomías típicas en zoología, por ejemplo, muestran una categorización en el nivel incorporado , con similitudes que conducen a la formulación de categorías "superiores" y diferencias que conducen a la diferenciación dentro de las categorías.

Categoría errónea editar ]

Una mala categorización puede ser una falacia lógica en la que objetos, conceptos, entidades, etc. diversos y diferentes se agrupan en función de denominadores comunes ilógicos o denominadores comunes que tienen en común prácticamente cualquier concepto, objeto o entidad. Una forma común en que se produce una mala categorización es a través de una categorización excesiva de conceptos, objetos o entidades, y luego una mala categorización basada en caracteres que virtualmente todas las cosas tienen en común.











La palabra china para " crisis " ( chino simplificado : 危机 ; chino tradicional : 危機 ; pinyin : wēijī ) se invoca con frecuencia en el habla motivacional occidental porque está compuesta por dos caracteres chinos que significan respectivamente "peligro" y "oportunidad". Mientras que el significado original de wēijī es "peligro en un punto de coyuntura", y muchos lingüistas y hablantes nativos chinos resaltan los errores en su reinterpretación occidental, el significado de "peligro más oportunidad" del término ha sido tan ampliamente utilizado por políticos, empresarios y en la cultura popular que su etimología alternativa ha sido recogida en todo el mundo, incluso por algunos hablantes nativos de chino.

Uso editar ]

El lingüista estadounidense Benjamin Zimmer ha rastreado menciones en inglés del término chino para "crisis" hasta un editorial anónimo en un periódico de 1938 para misioneros en China. [1] [2] Pero su uso probablemente cobró impulso en los Estados Unidos después de que John F. Kennedy empleó este tropel en discursos de campaña en 1959 y 1960: [2]
En el idioma chino, la palabra "crisis" se compone de dos caracteres, 
uno que representa peligro y el otro, oportunidad. [3]
Hacer referencia a la palabra se ha convertido desde entonces en un meme básico para los consultores de negocios y oradores motivacionales estadounidenses, así como para ganar popularidad en las instituciones educativas, la política y en la prensa popular. Por ejemplo, en 2007, la Secretaria de Estado Condoleezza Rice loaplicó durante las conversaciones de paz en Medio Oriente . [4] El ex vicepresidente Al Gore lo hizo tanto en un testimonio ante el Comité de Energía y Comercio de la Cámara de Representantes de EE. UU. , En la introducción de Una verdad incómoda , y en su conferencia de aceptación del Premio Nobel de la Paz . [5] [6]
Benjamin Zimmer atribuye el atractivo de esta anécdota a su "manejabilidad" como un recurso retórico y al "llamado a la acción" optimista, [7] , así como al " pensamiento ilusorio ". [8]

La mala traducción popular editar ]

El significado principal del segundo carácter en wēijī , pronunciado  , ( chino simplificado :  ; chino tradicional :  ) no es "oportunidad". [2] [9] El sinólogo Victor H. Mair de la Universidad de Pennsylvania afirma que la interpretación popular de wēijī como "peligro" más "oportunidad" es una "percepción errónea pública generalizada" en el mundo de habla inglesa . [8] Mientras que el personaje  ; lo que de hecho significa "peligroso" o "precario", es altamente polisémico y, de forma aislada, no se traduce como "oportunidad". [8] La confusión probablemente surge del hecho de que ;  es un componente de la palabra china para "oportunidad"jīhuì (機會 ;机会 , literalmente, "un punto crítico").
De acuerdo con la 10ª edición de Xinhua Zidian , el diccionario chino de mayor venta, el carácter  ;  en 危機 ; wēijī significa "un punto en el que las cosas suceden o cambian", este significado parece ser neutral, de lo cual se derivan otros dos significados: "un evento que tiene una naturaleza confidencial" y "oportunidad (oportunidad), buen momento" que parece ser una positiva [10]

Uso por hablantes nativos de chino editar ]

Sin embargo, incluso el chino mismo contiene la expresión "convertir el peligro en oportunidad" ( 化 危 为 机 ; huà wēi wéi jī ) usando estos dos caracteres exactos. Es posible que esta sea una traducción inversa del inglés, pero de cualquier manera no está claro que esta expresión popular sea verdaderamente una "mala traducción". investigación original? ]
El 1 de febrero de 2017, el profesor chino-estadounidense Shoucheng Zhang de la Universidad de Stanford, un especialista en física de materia condensada y aisladores topológicos , invocó la palabra, afirmando que combina "crisis" con oportunidad. Afirmó que la industria de la tecnología de la información se dirige hacia una crisis y una oportunidad, ya que la ley de Moore parece ser más difícil de sostener; y usó esto como una motivación para la oportunidad de la computación cuántica topológica en su conferencia especial. [11]Zhang afirmó (a las 14:48 en el video) que, mientras que la palabra "crisis" en las culturas occidentales tiene solo connotaciones negativas, en "nuestra cultura antigua [china] ya está reconocida". Luego afirmó que la limitada viabilidad de la ley de Moore es una crisis que también presenta una oportunidad para que Silicon Valley se reinvente a sí mismo a través de la computación cuántica .











desambiguación de Word Sense monolingües clásicas utilizan WordNet como su inventario de sentido y se basan en gran medida en la clasificación supervisada / semi-supervisada con los cuerpos anotados con sentido manual: [1]
  • El WSD de inglés clásico usa la WordNet de Princeton para detectar el inventario y la entrada de clasificación primaria se basa normalmente en el corpus de SemCor .
  • El WSD clásico para otros idiomas utiliza su respectiva WordNet como inventarios de sentido y los cuerpos anotados con sentido etiquetados en sus respectivos idiomas. A menudo, los investigadores también utilizarán el corpus de SemCor y bitexts alineados con el inglés como idioma de origen.

Sense inventarios editar ]

Durante el primer taller de Senseval se adoptó el inventario de sentido HECTOR. La razón para adoptar un inventario de sentido previamente desconocido fue principalmente para evitar el uso de los sentidos populares de palabras (como WordNet), que podrían hacer que los experimentos fueran injustos o sesgados. Sin embargo, dada la falta de cobertura de dichos inventarios, desde el segundo taller de Senseval, se adoptó el inventario de WordNet. Los ejercicios de WSD requieren un diccionario, para especificar los sentidos de las palabras que deben ser desambiguados, y un corpus de datos del lenguaje para ser desambiguados. WordNet es el ejemplo más popular de inventario de sentido. La razón para adoptar la base de datos HECTOR durante Senseval-1 fue que el inventario de WordNet ya estaba disponible públicamente. [2]

Descripción de la tarea editar ]

La comparación de métodos se puede dividir en 2 grupos por cantidad de palabras para probar. La diferencia consiste en la cantidad de análisis y procesamiento:
  • La tarea de todas las palabras implica desambiguar todas las palabras del texto.
  • La muestra léxica consiste en desambiguar algunas palabras objetivo previamente elegidas.
Se supone que la primera es una evaluación más realista, aunque con pruebas de resultados muy laboriosas. Inicialmente, solo se utilizó este último en la evaluación, pero luego se incluyó el primero.
Los organizadores de muestras léxicas tenían que elegir las muestras en las que se iban a probar los sistemas. Una crítica de las incursiones anteriores en la evaluación de la WSD de la muestra léxica es que la muestra léxica se había elegido según el capricho del experimentador (o, para coincidir con las selecciones de los experimentadores anteriores). Para English Senseval, se diseñó un marco de muestreo en el que las palabras se clasificaron según su frecuencia (en el BNC) y su nivel de polisemia (en WordNet). Además, la inclusión del problema de etiquetado POS fue una cuestión de discusión y se decidió que las muestras debían ser palabras con parte conocida del habla y algunos indeterminados (por ejemplo, 15 tareas nominales, 13 tareas verbales, 8 adjetivos y 5 indeterminados).
Para fines de comparación, se utilizan algoritmos conocidos, pero simples, denominados líneas de base. Estos incluyen diferentes variantes del algoritmo de Lesk o el algoritmo de sentido más frecuente .

Medidas de evaluación editar ]

Durante la evaluación de los sistemas WSD se utilizan dos medidas de rendimiento principales:
  • Precisión : la fracción de asignaciones del sistema que son correctas.
  • Recordar : la fracción del total de instancias de palabras asignadas correctamente por un sistema
Si un sistema realiza una asignación para cada palabra, entonces precisión y recuperación son lo mismo, y puede llamarse precisión . Este modelo se ha ampliado para tener en cuenta los sistemas que devuelven un conjunto de sentidos con ponderaciones para cada aparición.









La descripción cognitiva es un término usado en psicología para describir el funcionamiento cognitivo de la mente humana.
Una descripción cognitiva especifica qué información se utiliza durante una acción cognitiva, cómo se procesa y transforma esta información, qué estructuras de datos se utilizan y qué comportamiento se genera.

No hay comentarios:

Publicar un comentario