tag:blogger.com,1999:blog-6230959840389481677.post3303211077234446376..comments2023-08-13T02:31:07.189-07:00Comments on Oracle Notepad: SOUNDEX en españollferhttp://www.blogger.com/profile/00618392085702183279noreply@blogger.comBlogger47125tag:blogger.com,1999:blog-6230959840389481677.post-70494879154757404002016-11-10T08:10:47.084-08:002016-11-10T08:10:47.084-08:00Ya merito! =D
http://soundesp.somee.com/Fonetiz...Ya merito! =D <br /><br /><br />http://soundesp.somee.com/Fonetizador.asp<br /><br /><br />Saludos.El Rey Hidrógenohttps://www.blogger.com/profile/09199498157901900275noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-86103542433139126222016-10-08T10:48:09.355-07:002016-10-08T10:48:09.355-07:00El SundEsp ya esta listo y funcionando perfecto (e...El SundEsp ya esta listo y funcionando perfecto (en VB y C), sobre Nombres y Apellidos en Español, incluso sobre cadenas complejas o largas, como pueden ser direcciones, ej:<br /><br />del arbol kaido en vataya E2B 1FP4B 713E4 2K P1M1I1<br />Del árbol caido en batalla E2B 1FP4B 713E4 2K P1M1I1<br /><br />El alfabeto español se constituye de 27 letras únicamente, 22 consonantes, 5 vocales, y 5 Dígrafos. Los casos como ch, ll, rr, qu y gu (sh) son considerados DIGRAFOS, es decir, un grupo de dos letras que representan un solo sonido.<br /><br />Ejemplos de Fonetizador en español (palabras, código fonético):<br /><br />ABAKUA AVAKUA ABACUA AVACUA HABAKUA HAVAKUA HABACUA HAVACUA<br />1P1751 1P1751 1P1751 1P1751 1P1751 1P1751 1P1751 1P1751<br /><br />ACUAMAN AQUAMAN AKUAMAN<br />1751J1K 1751J1K 1751J1K<br /><br />QUIQUE KIKE<br />7372 7372<br /><br />ENRIQUE HENRIKE HENRIQUE<br />2KF372 2KF372 2KF372<br /><br />HERNANDEZ HERNANDES ERNANDES ERNANDEZ<br />2FK1KE26 2FK1KE26 2FK1KE26 2FK1KE26<br /><br />GUILLEN GUIYEN GUEVARA GEVARA<br />A3I2K A3I2K A2P1F1 92P1F1<br /><br />AREBOLA ARREBOLA<br />1F2P4B1 1R2P4B1<br /><br />CASTAÑEDA MAGAÑA CASTAÑON CASTAÑA<br />716M1H2E1 J1A1H1 716M1H4K 716M1H1<br /><br />El algoritmo de fonetización SoundEsp (Soundex en Español), es muy útil de implementarse en grandes Bases de Datos privadas, principalmente por Bancos y empresas dedicadas al análisis y otorgamiento crediticio y servicios financieros; como tiendas departamentales, telefonía celular, créditos hipotecarios, Cajas Populares y de Ahorro, etc., con la finalidad de ayudar a mitigar, reducir y controlar de mejor manera los riesgos en el otorgamiento de créditos al publico en general, mejorando en gran medida la toma de decisiones corporativa.<br /><br />Búscame en FB: https://www.facebook.com/Fonetizador-en-Espa%C3%B1ol-Soundex-1609415286018889/?ref=ts&fref=ts<br /><br />Saludos.El Rey Hidrógenohttps://www.blogger.com/profile/09199498157901900275noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-43156531870645422312016-10-05T00:24:24.028-07:002016-10-05T00:24:24.028-07:00Busca por Metaphone, es la version en ingles mejor...Busca por Metaphone, es la version en ingles mejorada por mucho! =D<br /><br />http://aspell.net/metaphone/metaphone-kuhn.txt<br /><br />Desarrollé un Fonetizador 100% en español hace ya algunos años, se usó para fonetizar la base de datos del Buró de credito en Mx sobre mas de 15 MILLONES DE REGISTROS DE TARJETAHABIENTES! y sigue vigente. Es para identificar nombres de personas o calles!, lo migraré a VB y esta a la venta ;-)<br /><br />avaz6677@gmail.com<br /><br />Saludos.El Rey Hidrógenohttps://www.blogger.com/profile/09199498157901900275noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-70771685478590851512012-11-08T21:18:20.603-08:002012-11-08T21:18:20.603-08:00Hola me he encontrado que morada, mareada, mirada,...Hola me he encontrado que morada, mareada, mirada, mierda, muerda dan el mismo resultado M630... no sé si asi debe ser. Gracias y saludosAnonymoushttps://www.blogger.com/profile/05821393730730787837noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-29058672932275500272012-08-08T04:43:55.447-07:002012-08-08T04:43:55.447-07:00@lfer: gracias por este gran aporte a la informáti...@lfer: gracias por este gran aporte a la informática hispana.<br />@Domenec: has conseguido implementar el SOUNESP para el catalá? <br />Yo creo que como es una lengua que difiere de manera considerable al español (ya que el catalán no es una variante del español (si del latín), sino más bien una mezcla de 5 idiomas, español, francés, portugués, italiano y rumano.<br /><br />Valdría la pena modificar SOUNDESP, para hacer un SOUNDCAT???<br /><br />O una variante de SOUNDESP en donde pueda recibir un parametro de la cultura o variante, por ejemplo: CA, EU, GA (Catalán, Euskera, Gallego).<br /><br />Que opinan?<br /><br />Yo podría buscar implementar para catalán, pero no soy catalán, ni muy experto en PL-SQL, aunque no parece muy complicado el código. Soy mexicano, así que agradecería mucho alguna ayuda de un parlante catalán que conozca bien las reglas de pronunciación.<br /><br />Saludos y nuevamente muchas gracias @lfer por este <b>GRAN GRAN</b> aporte.Anonymoushttps://www.blogger.com/profile/03849705495862731672noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-84924629065465730352012-08-08T03:49:05.134-07:002012-08-08T03:49:05.134-07:00Este comentario ha sido eliminado por el autor.Anonymoushttps://www.blogger.com/profile/03849705495862731672noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-60762090075754269572012-07-20T10:01:51.458-07:002012-07-20T10:01:51.458-07:00Hola. El algoritmo funciona mejor. Necesito detall...Hola. El algoritmo funciona mejor. Necesito detalles sobre tí, para incluirlo como una cita de autor de la versión SOUNDESP en mi tesis de grado sobre coincidencia de nombres. Es especialmente bueno en el tratamiento que hace de las letras combinadas con el sonido de la CH y la LL. Te he enviado un correo al gmail. Gracias.<br /><br />Delgado Juan C.Anonymoushttps://www.blogger.com/profile/11909984969523382914noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-9964906742088764032012-05-14T14:46:01.181-07:002012-05-14T14:46:01.181-07:00Gracias por el aporte. En Sql Server hay una funci...Gracias por el aporte. En Sql Server hay una función que se llama Difference, que devuelve un valor numérico de 0 a 4, el 4 significa que dos cadenas comparadas son iguales o casi iguales. Como aplico esto aquí. Como hago una comparación entre dos cadenas, como sé que son iguales o casi iguales??? Shuwer David LShuwer David Lhttps://www.blogger.com/profile/15206799218404377762noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-86096209616889882702012-03-21T10:00:33.952-07:002012-03-21T10:00:33.952-07:00Hola e implementado un algoritmo propio basandome ...Hola e implementado un algoritmo propio basandome en el soundesp y me esta funcionando bien. Tal vez me podrian ayudar a hacerlo mas robusto. donde prodria publicar el algoritmo (esta en MSQL) pero es facil de convertir a oracle.<br />mi correo es eampuerog@gmail.comAnonymousnoreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-66966907958336410122012-03-01T13:08:42.956-08:002012-03-01T13:08:42.956-08:00Estimado, buenas tardes: mi nombre es Luciano, tra...Estimado, buenas tardes: mi nombre es Luciano, trabajo buscando coincidencias de nombres, quería saber cómo se puede "ajustar" un poco más el parámetro de búsqueda de coincidencia. Por ejemplo, si comparo a JOSE LUIS GONZALEZ IBAÑEZ contra JOSE LUIS IBAÑEZ MIÑO que no haya coincidencia entre ellos porque son personas distintas. Otro ejemplo: MARIA DEL CARMEN GONZALEZ CONTRA MARIA DEL ROSARIO GONZALEZ. ¿se podría ajustar el parámetro o porcentaje de coincidencia?Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-3993046793727940182012-01-10T09:49:41.791-08:002012-01-10T09:49:41.791-08:00Hola!
Antes que nada, felicitaciones por la publi...Hola!<br /><br />Antes que nada, felicitaciones por la publicación, es muy interesante, de hecho, lo he adaptado a un proyecto en otro lenguaje.<br /><br />Sin embargo, he detectado que para algunas palabras produce el mismo resultado, por ejemplo:<br />"Nacional" y "Nacionalidad" lo mismo ocurre con palabras cortas como "ley" y "la".<br /><br />Un cordial saludo,Gustavo Andrés Arriola O.https://www.blogger.com/profile/17327161991441723554noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-86968936206004761222011-10-03T05:49:21.411-07:002011-10-03T05:49:21.411-07:00Hola,
muchas gracias por tu código. Ha sido de gr...Hola, <br />muchas gracias por tu código. Ha sido de gran ayuda.<br /><br />Creo que ayudaría en la búsqueda fonética, convertir los números a palabras:<br /><br />1 = UNO<br />2 = DOS<br />...<br />22= VEINTIDOS O VEINTE Y DOS<br />...<br /><br />Saludos,Alejandrohttps://www.blogger.com/profile/03968260378167625369noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-69993668825885611292010-10-28T10:32:07.668-07:002010-10-28T10:32:07.668-07:00Si yo también probé Cemento con Zenda y los result...Si yo también probé Cemento con Zenda y los resultados indican que son iguales.Juannoreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-461406138619727432010-10-15T16:45:36.682-07:002010-10-15T16:45:36.682-07:00Hola, buenos aportes pero quisiera saber porq sale...Hola, buenos aportes pero quisiera saber porq sale q es igual 'cemento' y 'zenda'Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-56349177201753030322010-08-06T06:20:24.507-07:002010-08-06T06:20:24.507-07:00Una observación: el algoritmo Soundex en su defini...Una observación: el algoritmo Soundex en su definición más conocida no indica un tratamiento de errores tipográficos de las cadenas de entrada, tales como consonantes dobles, espacios, o símbolos no alfanuméricos. <br /><br />Teniendo esto en cuenta, las palabras "vvaca" y "vaca" deberían tener diferente codificación si seguimos las reglas basicas, ya que la segunda consonante luego de la primera es 'v'(=1) en el primer caso y 'c'(=0) en el segundo.<br /><br />La implementación de Oracle aparentemente tiene un tratamiento de la cadena para este tipo de casos, pero sería una característica extra algoritmo.<br /><br />Me parece buena idea agregar ese "accesorio" para acercarnos lo más posible a la función de Oracle.<br /><br />Próximamente estaré disponibilizando una nueva versión.<br /><br />Gracias por la contribución!<br /><br />Saludoslferhttps://www.blogger.com/profile/00618392085702183279noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-85019205919540628612010-08-05T08:10:13.047-07:002010-08-05T08:10:13.047-07:00Hola que tal
Creo que encontré otro bug que tien...Hola que tal <br /><br />Creo que encontré otro bug que tiene que ver con letras iguales al principio. por ejemplo vaca y vvaca, juan y jjuan. Cada pareja debería arrojarme el mismo resultado.<br /><br />saludos y gracias por el paqueteAnonymousnoreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-37467621429993663362010-07-28T05:59:37.026-07:002010-07-28T05:59:37.026-07:00Agradezco tu comentario y no comparto tu ejemplo. ...Agradezco tu comentario y no comparto tu ejemplo. No pasa por ser inglés o castellano, el propio algoritmo SOUNDEX iguala los fonemas 'S' y 'C' (o K), eso es independiente del idioma. Tanto 'acronym' como 'asteroid' asignan un valor 2 en su segunda posición.<br /><br />Bien es sabido que SOUNDEX tiene sus limitaciones y no es perfecto, pero no era mi intención arreglarlo sino implementar precisamente, SOUNDEX.lferhttps://www.blogger.com/profile/00618392085702183279noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-12582150743683616042010-07-28T01:50:36.405-07:002010-07-28T01:50:36.405-07:00Basarse en el codigo en ingles SOUNDEX, me parece ...Basarse en el codigo en ingles SOUNDEX, me parece que ya esa arrastar un erro de concepcion fonetica, por ejemplo segun tu codigo "Alicante" es igual que "Aliciente", con el codigo A425, cuando una sonaria "alikante" y la otra sonaria "alisiente", considero que el codigo debe ser realizado desde cero, y no basandose en el codigo anglosajón, porque asignar a la c un solo valor cuando puede sonar como S o como K es un error graveTabrisiushttps://www.blogger.com/profile/03364577006079782282noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-46731491442110581482010-03-04T05:05:58.970-08:002010-03-04T05:05:58.970-08:00Akinet, he corregido el bug, muchas gracias por el...Akinet, he corregido el bug, muchas gracias por el aporte! Acertaste en acusar a la funcion map_num :)<br /><br />Ya está disponible para descargar en el link arriba.<br /><br />Saludoslferhttps://www.blogger.com/profile/00618392085702183279noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-9792924736517657492010-02-23T10:22:52.949-08:002010-02-23T10:22:52.949-08:00Hola lfer.
Antes que nada gracias por tu blog y en...Hola lfer.<br />Antes que nada gracias por tu blog y en especial por este package que espero me sea útil (<i>Estoy evaluando todavía si este es el camino por el que quiero que vaya mi proyecto</i>). <br /><br />He detectado que con ciertas combinaciones con la letra G el resultado que devuelve no está en el formato A000. Te dejo unos ejemplos: MAGUFO - MG10, MANGANTE - M5G5, SUBMAGO - S15G.<br />No he mirado mucho pero creo que tiene que ver con la funcion map_num que no asigna equivalencia numérica a la G.<br /><br />Gracias!!Akinetnoreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-23845765513680000742009-11-09T05:07:15.644-08:002009-11-09T05:07:15.644-08:00La tabla de conversión expuesta en el paso básico ...La tabla de conversión expuesta en el paso básico número 3 no está actualizada conforme al código vigente de la aplicación.<br />Por lo demás, me ha sido muy útil para mi propia rutina (en ASP VbScript, para aplicarla próximamente en la rutina de búsqueda interna de mi sitio web).<br />Muchas gracias.Ricardo de la Vega Cotarelohttp://www.hipocampo.org/noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-38858103167533763352009-08-17T15:06:39.868-07:002009-08-17T15:06:39.868-07:00Gracias lo he estado testeando y si esta perfecto,...Gracias lo he estado testeando y si esta perfecto, gracias por la ayuda.Xibalba'https://www.blogger.com/profile/09930368713591974228noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-40358778259963979632009-08-17T12:27:36.025-07:002009-08-17T12:27:36.025-07:00Hola,
Gracias por tu valioso aporte, he subido ot...Hola,<br /><br />Gracias por tu valioso aporte, he subido otra versión corrigiendo un error de conversión. Puede ser que solucione tu problema.<br /><br />Saludoslferhttps://www.blogger.com/profile/00618392085702183279noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-66209307574889926432009-08-17T09:10:06.288-07:002009-08-17T09:10:06.288-07:00Gracias por la pronta respuesta solo que creo que ...Gracias por la pronta respuesta solo que creo que expuse mal mi pregunta. Mi dura era que parte del código podría modificar para que Basquez y Valle me den resultados distintos, porque intente con lo que me dijiste de modificar la silaba “YE” pero creo que no he entendido el funcionamiento de la rutina cnv_dos, perdón por tanta pregunta.Xibalba'https://www.blogger.com/profile/09930368713591974228noreply@blogger.comtag:blogger.com,1999:blog-6230959840389481677.post-4575923613917771692009-08-17T08:58:12.152-07:002009-08-17T08:58:12.152-07:00Hola,
El caso de Valle y Baye es sutil y depende ...Hola,<br /><br />El caso de Valle y Baye es sutil y depende un poco de la región. En el Rio de la Plata, el Caribe o España, esa sílaba puede tener diferente sonido. En ese caso, es preferible dar el mismo valor equivalente. <br />De todas formas, si deseas personalizar el código puedes alterar la funcion cnv_dos dentro del paquete, y asignar una letra diferente a la sílaba YE.<br /><br />Espero que te sirva.<br /><br />Un abrazolferhttps://www.blogger.com/profile/00618392085702183279noreply@blogger.com