Sémantique de corpus : auto apprentissage de domaines sémantiques, regroupements et pondération de termes à partir d'un parcours de réseau sémantique Début : Février 2014 Durée : 6 mois à 1 an Lieu : Boulogne-Billancourt Eptica est le leader français et international des solutions de réponse client multi-canal (WCS). Principalement implanté en France, au Royaume Uni et à Singapour, EPTICA édite une solution reconnue qui s'adresse aux grands comptes et au mid-market dans les secteurs du Retail, de la Finance, de l'Assurance, du Secteur Public et des Services. Eptica compte 400 clients, parmi lesquels la Société Générale, le Crédit Agricole, la CNAM, la MAAF, Darty, Pixmania, Carrefour, La Redoute..., en France et aussi à l'international comme Air Asia, Panasonic... Depuis 2013, Eptica intègre le moteur de recherche sémantique et les outils d'extraction de contenu issus de la société Lingway. Ces outils mettent en oeuvre des grammaires d'analyse et d'extraction d'informations, un réseau sémantique adapté pour le monde de la relation client, et des stratégies de recherche documentaire spécifiques. Dans le cadre des évolutions de son offre, EPTICA propose un stage conventionné niveau M2, basé à Boulogne-Billancourt. Au sein de l'équipe R&D, le candidat participera aux tâches d'exploitation des ressources sémantiques du dictionnaire Eptica, à des fins de désambiguïsation et de regroupements syntaxiques de termes : - Proposition de regroupements de termes extraits, sur la base du parcours du réseau sémantique. Pondération sémantique des éléments extraits - Etude d'enrichissement du réseau sémantique à partir de corpus (par exemple Wikipedia) - Ciblage des domaines sémantiques à exploiter, à partir de probabilités calculées sur corpus d'une application donnée Compétences requises : - Traitement Automatique des Langues (étude de corpus, moteur de recherche, grammaires locales, techniques de « machine learning ») - Des connaissances en programmation/scripting (Java, Groovy, Perl, ...) - La maîtrise du français et de l'anglais, la connaissance d'autres langues européennes serait un plus - Bonnes capacités d'analyse et autonomie - Facilité à travailler en équipe Contact:Cécile Potier cecile.potier@eptica.com Cécile Potier Chef de produit linguistique 95 bis rue de Bellevue 92100 Boulogne-Billancourt Bureau : +33 (0)9 53 07 60 81 Fax : +33 (0)1 47 12 68 89 Email : cecile.potier@eptica.com http://www.eptica.com/?lang=fr http://epticaexpress.wordpress.com/ http://www.linkedin.com/company/eptica?trk=cp_followed_name_eptica https://www.facebook.com/EpticaFrance?fref=ts https://twitter.com/EpticaFrance