Blog..com
Créer votre Blog Emploi

Wiki Blogs Favoris

Technico-commercial SI

Aller au contenu | Aller au menu | Aller à la recherche

Tag - alimentation des systèmes d information

Fil des billets - Fil des commentaires

vendredi 13 novembre 2009

Le text-mining (fouille de textes)

Dans l’article « Les sources d’information officielle », je mentionne les JAL (Journaux d’Annonces Légales) qui sont une source importante d’informations.

Comme son nom l’indique, il s’agit de journaux dans lesquels l’information est publiée sous forme d’annonce.

Contrairement aux autres sources comme l’INSEE, la source JAL n’est donc pas un flux de données structurées transmis par l’informatique. En effet, il faut compter sur un traitement particulier pour transformer les informations de source JAL en données structurée.

Il faut commencer par s’abonner aux différents journaux. Pour trouver les JAL de tous les départements, le site http://www.jurishop.fr/ propose son annuaire.

JAL
A réception d’un journal, il faut numériser les pages sur lesquelles on trouvera les annonces.
Page JAL

Il faut ensuite isoler les annonces en faisant des captures de zone à l’écran, ce qui permet d’avoir une image pour chaque annonce.

Annonce JAL
Chacune de ces images devra ensuite faire l’objet d’une reconnaissance de texte par OCR (on dit : « océriser »), ce qui permet d’obtenir un texte et non plus une image.

S.C.P. KERMARREC-MOALIC Avocats au Barreau de QUIMPER 62 Quai de l’Odet -29196 QUIMPER Cedex Tél 02.98.55.09.57 Cabinet secondaire 34, rue Monge 29200 BREST

ARMEMENT BILLIEN THIERRY S.A.R.L au capital de 349 200 Euros Siège Social 16, Hent Penker Bloas Vihan 29120 PLOMEUR 444988117 R.C.S. QUIMPER

L’assemblée générale extraordinaire du 19 octobre 2009 a réduit le capital social de 298 600 € par voie de réduction de la valeur nominale des parts. L’article 7 des statuts a été modifié en conséquence. Ancienne mention Le capital social est fixé à trois cent quarante neuf mille deux cents euros (349 200 €). Nouvelle mention Le capital social est fixé à cinquante mille six cents euros (50 600 €).

Pour avis, La Gérance


Maintenant que l’annonce est sous la forme d’un texte, il faut retrouver l’information nécessaire à l’alimentation d’une base de données, c'est-à-dire :
Le numéro de SIREN de l’entreprise concernée est : 444988117
L’événement est : réduit le capital social
L’ancienne valeur est : 349 200
La nouvelle valeur est : 50 600

Le text-minig consiste à extraire ces informations de l’annonce de manière automatique. Pour cela, des sociétés d’édition spécialisée dans l’informatique et l’intelligence artificielle adapteront leur programme à la fonction demandée. Sinon, il est toujours possible de se lancer dans les développements informatiques pour résoudre cette problématique. Dans les 2 cas, il faudra prévoir une procédure manuelle pour intégrer les rejets, c'est-à-dire les cas pour lesquels l’automate ne sera pas capable de traiter l’annonce. Evidemment, l’objectif de l’automatisation est d’avoir un minimum de rejets.

dimanche 8 novembre 2009

L’adaptation de l’offre face aux obligations des clients

Dans l’article « Qui sont les clients ? », je fais mention des grands comptes qui sont les premiers à investir dans des solutions automatisées. Pour commencer à rentrer dans le détail de leurs motivations, je vous propose de voir deux cas pour lesquels les grands comptes sont dans l’obligation de trouver une offre adaptée.

1er cas

Logo MAEEDans le cadre de la réglementation Bâle II et de la troisième directive européenne (lutte contre le blanchiment et le financement du terrorisme), les banques ont mis en place leur projet KYC (Know Your Customers). La 3ème directive européenne a été publiée le 26 octobre 2005 au Journal Officiel de l’Union Européenne. Les banques savaient qu’elles auraient deux ans avant que la directive européenne devienne une obligation nationale. C’est donc dans ce contexte qu’en 2007 j’ai géré 2 projets de clients « banque ». Dans le BtoB, cela s’est traduit par le fait d’intégrer dans le SI les données Actionnaires et Mandataires des entreprises clientes des banques. Concrètement et pour faire simple, la base de données de la banque contient des entreprises clientes (SIRET, Raison sociale, adresse, nom du principal dirigeant…). Pour en savoir plus sur ces entreprises clientes, la banque cherche à enrichir sa base de données avec l’identification des actionnaires et des mandataires. Ainsi, la banque vérifiera que les entreprises clientes, mais aussi leurs actionnaires, et leurs mandataires ne sont pas présents dans une « liste noire » (blacklist). Pour répondre à ce besoin, il a fallu adapter l’offre en proposant une solution de diffusion de l’information Actionnaire/Mandataire. Les demandeurs sont des institutions financières (grands comptes), il fallait donc anticiper le fait que cette offre aurait un module de diffusion spécifique pour chaque institution.

2ième cas

JALLes entreprises accordent des créances à leurs clients. Ces clients peuvent un jour passer en procédures collectives, redressement judiciaire, liquidation judiciaire, ventes et cessions de fond de commerce, et dans ces cas l’information sera publiée officiellement au BODACC. Les créanciers ont 10 jours après la date de publication pour se manifester et ainsi tenter de récupérer leur créance. L’offre Marketing est de mettre le portefeuille clients sous la surveillance des procédures collectives et ventes et cessions de fond de commerce. La contrainte technique est de diffuser les publications dès leur parution selon un modèle automatisé et souvent différent pour chaque client.

jeudi 29 octobre 2009

Les sources d’information officielle

Dans l’article « Autour de l’information entreprise », je fais mention des différentes sources officielles dans le cadre de la collecte des informations sur les sociétés françaises. Pour commencer à rentrer dans le détail, je vous propose un passage en revue des différentes sources.

  • INSEE

Logo INSEEL’INSEE (l’Institut National de la Statistique et des Etudes Economiques) est la principale source de données (http://www.insee.fr). Il est à l’initiative du répertoire SIRENE (Système d'Identification du Répertoire des ENtreprises et de leurs Etablissements). Les entreprises françaises sont identifiées par un numéro unique : le SIREN (Système d'Identification du Répertoire des ENtreprises). Les établissements français sont identifiés par un numéro unique : le SIRET (Système d'Identification du Répertoire des ETablissements). Le SIREN est constitué de 9 chiffres. Le SIRET est constitué du SIREN suivi de 5 chiffres : le NIC (Numéro Interne de Classement).

Pour chaque établissement identifié, l’INSEE propose des fichiers enrichis de nombreuses informations détaillées sur http://www.sirene.fr

On trouvera dans les grandes lignes :

  • les éléments d'identification et d'adresses des établissements au format postal (SIREN, SIRET, adresse),
  • des éléments sur la localisation géographique de l'établissement (région, département, commune, rue...),
  • des caractéristiques économiques de l'établissement et de l'entreprise (activité, tranche d'effectifs, chiffre d'affaires...),
  • le caractère exploitant de l'établissement ou de l'entreprise,
  • les activités secondaires,
  • la date de création de l'entreprise,
  • l'adresse du siège.

Les conditions commerciales sont disponibles sur http://www.sirene.fr/Conditions_commerciales/.

  • RCS

Logo RCSLe RCS (Registre du Commerce et des Sociétés) est une source de données publics, gérées par les Greffes, et disponibles sur http://www.infogreffe.fr.

Documents disponibles :

  • un extrait RCS (Kbis) : fiche d'identité de l'entreprise,
  • l'historique des inscriptions modificatives au RCS,
  • les derniers statuts à jour,
  • procédure de sauvegarde, redressement et liquidation judiciaire,
  • le dernier compte annuel déposé : bilan, compte de résultat, état des créances et état d'endettement


  • BODACC

Logo JOLe BODACC (Bulletin Officiel Des Annonces Civiles et Commerciales) est également une source de données publics (http://www.journal-officiel.gouv.fr/abonnements-jo-et-opoce/bodacc.html), gérées par la DJO (Direction des Journaux Officiels), un service du Premier ministre français, et disponibles sur http://www.bodacc.fr.

Informations publiées :

  • les ventes et cessions,
  • les immatriculations,
  • les créations d'établissements,
  • les modifications et radiations de personnes physiques ou morales inscrites au registre du commerce et des sociétés,
  • les procédures collectives,
  • les avis de dépôt des comptes des sociétés.


  • BALO

Logo JOLe BALO (Bulletin des Annonces Légales Obligatoires) est encore une source de données publics, gérées par la DJO (Direction des Journaux Officiels), un service du Premier ministre français, et disponibles sur http://www.journal-officiel.gouv.fr/balo/.

Informations publiées :

  • Actions et parts
  • Réduction de capital
  • Regroupement d'actions
  • Fusions et scissions
  • Liquidations


  • DATANEO

Logo DATANEODATANEO est le rediffuseur officiel de la base France Télécom qui est nécessaire à la bonne tenue des numéros de téléphone et de fax. http://www.dataneo.fr/

  • JAL

Les JAL (Journaux d’Annonces Légales) sont également une source d’informations utiles. Pour trouver les JAL de tous les départements, le site http://www.jurishop.fr/-Journaux-d-annonces-legales- propose son annuaire.

Informations publiées :

  • Création
  • Liquidation
  • Dissolution
  • Augmentation de capital
  • Réduction de capital
  • Changement d'adresse
  • Changement d'administrateur
  • Changement de dénomination
  • Changement d’objet social
  • Nomination d'un cogérant
  • Changement de forme juridique
  • Cession de fonds de commerce
  • ...


  • SNA

Logo SNALe SNA (Service National de l’Adresse) est le fournisseur de données d’adresses postales. Il est le garant de la mise en œuvre de la qualité de l’adresse en France. Il a élaboré la base de données (le référentiel) des localités, des codes postaux, des voies, et des numéros. Ce référentiel est indispensable pour les logiciels de correction d’adresse (RNVP : Restrucuration Normalisation Validation Postale). Pour cela, le SNA propose son référentiel et un abonnement aux mises à jour de chaque fichier :

  • Hexaposte est le fichier référence des codes postaux et CEDEX de France

http://www.laposte.fr/sna/rubrique.php3?id_rubrique=40

  • Hexavia est le fichier référence des libellés de voie

http://www.laposte.fr/sna/rubrique.php3?id_rubrique=41

  • Hexaclé (en complément d’Hexavia) est le fichier référence des numéros des voies

http://www.laposte.fr/sna/rubrique.php3?id_rubrique=42

  • CEDEXA est le fichier référence pour le contrôle de l’adresse CEDEX des entreprises

http://www.laposte.fr/sna/rubrique.php3?id_rubrique=43

lundi 25 août 2008

Qui sont les clients ?

Dans cet article, mon objectif est de faire le tour des profils des clients sur ce marché.
Solution d'alimentation d'un CRM avec des informations sur les entreprises : qui sont les clients ?

Même sur le marché du B2B, l'approche des entreprises face à la gestion de la relation client est en constante évolution. Les entreprises visant une clientèle d'entreprises ont maintenant le réflexe Internet quand il s'agit de trouver une information. Ce besoin évolue dès lors que l'organisation de l'entreprise vise à systématiser la recherche d'information et l'intégration de l'information dans le SI interne (logiciel de CRM). L'entreprise commence par systématiser les procédures des collaborateurs, et très vite l'entreprise cherche à automatiser les procédures.

Les grands comptes sont les premiers à investir dans des solutions automatisées. Les grandes entreprises sont aussi les plus rapides à rentabiliser un tel investissement, en tous les cas, elles mesurent cette rentabilité et lancent des appels d'offre sur le marché.
A ce jour, toutes les grandes entreprises ont leur solution déjà en place. Elles peuvent demander des évolutions, ou chercher à mettre les prestataires en concurrence pour faire baisser les coûts.

Par contre, toutes les PME ne sont pas forcément déjà organisées. On pourrait penser qu'il y a un réel marché potentiel : qu'en est-il ?
Les PME sont-elles demandeuses ? Toutes ne mesurent pas encore le besoin d'automatisation, ni la rentabilité d'un tel investissement, et c'est probablement pour des raisons légitimes.
Différents facteurs sont à prendre en compte, comme le coût de la solution qui dépend directement du nombre de clients. Une entreprise qui tourne très bien avec très peu de clients, sera capable de les gérer sans le besoin d'automatiser les procédures ; même raisonnement pour une entreprise dont le potentiel de prospection est limité par une activité de niche.
Pour les autres PME, nous pouvons considérer que le besoin existe. Comme pour les grandes entreprises, si la PME est déjà cliente d'une solution, elle pourra demander des évolutions et régulièrement remettre les prestataires en concurrence.
Par contre, à l'échelle de certaines PME, le budget est trop important et l'on peut remarquer une certaine frilosité à l'annonce des tarifs des solutions automatisées.

Toutefois, pour essayer de mesurer le potentiel de nouveaux clients type PME, je m'intéresse à l'évolution des ventes des solutions logiciels de CRM. Pour cela, il y a le salon Solutions CRM & BI (http://www.salons-solutions.com/fr/mvi/). Le site annonce les résultats d'une étude qui prévoit une progression de 12% des ventes entre 2008 et 2009.
Ma conclusion est simple, s'il y a de nouveaux clients en solutions logiciels, il y aura de la demande pour automatiser l'alimentation.

Alors, rendez-vous sur le salon ?