loi,zipf,mandelbrot
Forums > SciencesAller à la dernière page
<< Précédent |

La loi de Zipf-Mandelbrot

| Suivant >>
Ecrire une réponseAjouter à vos forums favoris
Paganel, antisémantique - 980920lui écrire blog Publié le 11/05/2004 à 10:41 Demander à la modératrice de supprimer ce forum
Il paraît que si l'on prend tous les mots de ce pavé qu'est "Ulysse" de James Joyce, et qu'on les classe par ordre de fréquence décroissante:

- le premier apparaît environ 8000 fois
- le dixième environ 800 fois
- le centième environ 80 fois
- le millième environ 8 fois

Cette loi empirique de Zipf, Mandelbrot (celui des fractals) a montré qu'elle pouvait correspondre à un souci d'utilisation optimale des ressources de la mémoire (humaine). Il faisait intervenir le "coût" de stockage d'un mot dans le cerveau, le supposait proportionnel au "coût" de son usage, et la répartition la plus économe en ressources donnait une loi très voisine de celle de Zipf (avec juste un coefficient correcteur expliquant le coude de la courbe).

L'usage des mots sur ce serveur suit-il une loi de Zipf?
1020734 Publié le 12/05/2004 à 10:23 supprimer cette contribution
c'est à dire ? moins un mot est utile, plus il mange de l'espace mémoire injustifié et plus il doit etre compressé ? c'est ça ?
Paganel, antisémantique - 980920lui écrire blog Publié le 12/05/2004 à 10:45 supprimer cette contribution
Le détail est donné par Brillouin dans "Science et théorie de l'information" (à lire plutôt en anglais, car la typo du bouquin français est une horreur!), mais voici ce que j'en ai à peu près retenu:

- stocker N choses d'une manière où on puisse les retrouver ne peut se faire mieux qu'avec un coût en N log N (chez moi, hélas, ce serait plutôt en N² ! Et prière de lire cela factorielle N²)

- le contenu en information d'un message est donné par la bonne vieille formule d'entropie de Shannon, moins sigma p(i) log p(i)

Après avoir tourné sa manivelle à calculs symboliques, Mandelbrot en arrive à la conclusion que la loi de fréquence des mots est en

f(i) = a x (b+i)^-c

Dans le cas très particulier où b = 0 et c=1, on retrouve la loi de Zipf (a est un simple coefficient normalisateur). "c" est plutôt voisin de 1,2 dans toutes les langues du monde, et de 1,6 chez les enfants. Le problème est de trouver b et c sur un corpus donné, car il serait bien entendu aberrant d'utiliser une méthode des moindres carrés pour les déterminer.

Pour la compression des mots, voir plutôt les travaux de Huffman(n?). Le français fait à peu près un bit par lettre, comme il est facile de le vérifier chez soi avec un ami. Son facteur de redondance est donc de 4,75, ce qui assure une bonne stabilité à la communication.
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 03:22 supprimer cette contribution
Pour ceux qui désireraient tester la loi de Zipf-Mandelbrot sur un corpus réel, voici une liste de mots de tout un fil, classée par ordre de nombre d'occurrences décroissants (mots de 3 lettres ou plus uniquement).

Vous n'avez plus qu'à copiercoller, importer dans Excel et demander le graphique en axes log-log. Si Zipf a raison, ça fait à peu près une droite. Si c'est Mandelbrot, une courbe coudée.
Citation:
1587 pour
1198 vous
1163 mais
1021 dans
834 bien
788 nous
751 tout
695 plus
688 tous
679 mots
590 merci
558 elle
538 amour
517 suis
499 comme
492 vrac
474 nuit
465 bonne
454 sans
445 fait
414 encore
408 tichou
408 coeur
394 faire
383 avec
365 alors
353 sont
353 quand
315 aussi
314 gimel
309 être
297 vais
292 temps
287 rien
279 automobiles
278 même
275 aime
273 bonheur
264 cette
264 toutes
240 ptitange
239 trop
234 dire
230 imagine
219 sais
217 bisous
215 rêves
213 soir
211 toujours
205 faut
200 lire
200 plaisir
195 juste
183 monde
183 beau
181 fais
180 peut
178 bonsoir
171 rubis
169 journée
167 jour
164 voir
161 deux
159 belle
157 demain
154 yeux
153 soleil
152 veux
152 doux
152 puis
152 très
151 plein
150 bonjour
149 vracs
146 tant
143 cela
142 envie
141 enfin
141 jamais
140 heure
139 leur
138 douce
137 donc
134 viens
134 amitié
133 toute
130 allez
129 avoir
129 vraiment
129 hein
128 aller
126 vrai
125 sister
125 sens
123 autres
123 fois
122 amis
119 quoi
119 vers
119 autre
118 quelques
114 sourire
113 sous
112 laisse
111 mieux
110 démi
108 reste
107 matin
106 était
106 notre
105 bravo
105 miminou
104 tête
104 petit
104 grand
101 mimi
101 aujourd
101 laisser
100 citation
100 leurs
99 peux
98 quel
98 gros
98 voilà
96 comment
95 coucou
94 jours
94 déjà
94 passe
94 font
93 jolie
92 vent
90 après
90 vois
90 ciel
90 elles
90 celui
89 jolis
88 votre
88 parce
87 fond
87 vraqueurs
87 avant
86 aimer
86 pourquoi
86 crois
85 coeurs
85 avais
84 ceux
83 sera
83 parfois
82 phénissia
82 coup
82 joker
81 ange
81 chaque
80 douceur
80 écrire
80 filles
80 rire
79 loin
78 capitaine
77 passer
77 bras
74 pensées
73 fort
73 arrive
72 naejlou
72 tiens
72 beaux
71 passé
71 maintenant
71 vraqueuses
70 dodo
69 chez
69 souvent
68 vivre
68 prends
68 vite
67 ptit
67 donne
66 heures
66 soit
65 moment
65 quelle
65 sommes
65 celle
65 santino
64 longtemps
64 main
64 baisers
64 milady
64 adore
64 moments
63 surtout
63 larmes
63 moins
63 sait
63 pense
62 croire
61 bout
61 café
61 salut
61 raison
60 tellement
60 tendresse
60 beaucoup
59 superbe
58 êtes
58 entre
57 vient
57 prendre
57 pourtant
56 soirée
56 jusqu
54 ariel
54 trouver
54 écrits
54 maux
54 rêve
53 besoin
53 instant
53 venir
53 joie
52 peur
52 chaleur
52 terre
52 mettre
52 triste
52 passage
52 partager
52 place
52 magnifique
52 histoire
51 contre
51 cœur
51 avait
51 ailleurs
50 noir
50 fête
50 petite
50 depuis
50 haut
50 tite
50 tard
49 vont
49 savoir
49 devant
49 froid
49 rêver
49 seul
49 parler
49 mains
48 fous
48 personne
48 homme
48 bientôt
47 forum
47 demi
47 souhaite
47 joli
47 étais
46 tichounette
46 nuits
46 pieds
46 regard
46 tour
46 espoir
46 trouve
45 peine
45 veut
45 attends
45 vraqueux
44 chose
44 instants
44 présent
44 parle
44 carlow
44 retrouver
44 sentiments
44 faites
43 manque
43 oublier
43 espère
43 louli
43 peau
43 pouvoir
42 chacun
42 dois
42 prend
42 serait
42 chemin
42 petits
42 assez
41 près
41 grande
41 idées
41 mille
41 silence
41 trois
41 doigts
41 pris
40 émotions
40 plume
40 partie
40 super
40 choses
40 prof
40 kikou
39 combien
39 vraquer
39 celles
39 dont
39 donner
39 amours
39 part
39 fini
39 écrit
38 chanson
38 corps
38 chaud
38 nouveau
38 fleurs
38 santi
38 gens
37 trouvé
37 face
37 seule
37 attend
36 bois
36 voudrais
36 pied
36 viennent
36 retour
36 bleu
36 couleurs
36 belles
36 avez
36 printemps
36 rejoindre
36 doit
36 coups
36 compris
35 envies
35 courage
35 penser
35 vague
35 compte
34 meme
34 mort
34 musique
34 jouer
34 miam
34 heureux
34 souvenirs
34 chanter
34 voyage
34 comprendre
34 douleur
34 scoodi
33 etre
33 sent
33 bienvenue
33 voulais
33 porte
33 long
33 ainsi
33 douleurs
32 avons
32 quelque
32 suite
32 bisou
32 seulement
32 lumière
32 pleine
32 puce
32 rires
32 hier
32 pluie
32 tendre
31 dernier
31 rime
31 heureuse
31 bulle
31 bercée
31 sortir
31 bruit
31 regarde
31 joue
31 route
30 tits
30 kiki
30 connais
30 candy
30 aura
30 texte
30 partage
30 sentir
30 pleurer
30 paradis
30 miel
30 vide
30 droit
30 presque
29 grands
29 train
29 baiser
29 voui
29 cherche
29 paix
29 façon
29 émotion
29 aurai
29 reviens
29 boulot
29 serai
29 file
29 monsieur
28 chagrin
28 enfants
28 truc
28 solitude
28 folie
28 suffit
28 point
28 simplement
28 attendre
28 oublie
28 beauté
28 message
28 coucher
28 passant
28 étoiles
28 lola
28 pleurs
28 souffle
28 pire
27 esprit
27 vagues
27 pages
27 cadeau
27 partir
27 dimanche
27 ptits
27 tourments
27 arrête
27 perdre
27 voix
27 post
27 petitange
26 goût
26 reves
26 savais
26 haine
26 trac
26 écris
26 phrases
26 simple
26 aurais
26 entends
26 nouvelle
26 chercher
26 importe
26 plutôt
26 parmi
25 chemins
25 certains
25 titange
25 semaine
25 force
25 entendre
25 regarder
25 délires
25 déposer
25 offre
25 lettres
25 poser
25 pensée
25 nuages
25 amies
25 pardon
25 peurs
25 sinon
25 dessus
25 oublié
25 poèmes
25 dedans
25 pauvre
24 boire
24 arrêter
24 arriver
24 blanc
24 dame
24 tomber
24 mets
24 histoires
24 page
24 semble
23 cartes
23 sang
23 existe
23 attention
23 repos
23 poésie
23 garde
23 jeux
23 doute
23 danse
23 écran
23 vouloir
23 dors
23 chouette
23 tites
23 accord
23 mine
23 voit
23 délire
23 passants
23 sommeil
23 ordi
23 demande
22 aucun
22 écouter
22 cours
22 couette
22 sublime
22 premier
22 comprends
22 cris
22 autant
22 lorsque
22 apprécie
22 bibou
22 réel
22 reine
22 chance
22 lignes
22 pause
22 poème
22 coin
22 clavier
22 femme
22 parti
22 paroles
22 photo
22 ensemble
22 dehors
22 loups
22 marche
22 enfant
22 commence
22 longue
22 rose
22 textes
21 excellente
21 travers
21 perdu
21 grave
21 passion
21 bercer
21 amoureux
21 oups
21 contente
21 passantes
21 disent
21 difficile
21 retard
21 neige
21 site
21 partout
21 espérer
21 phenissia
21 gris
21 magique
20 sort
20 ouvre
20 infini
20 revoir
20 pendant
20 crier
20 doucement
20 dites
20 quotidien
20 océan
20 quelqu
20 minutes
20 quitter
20 chante
20 morphée
20 futur
20 reprendre
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 10:10 supprimer cette contribution
Le graphique des résultats précédents en courbe log-log a été posté ici.

Il semble qu'un ou deux aigris (les mêmes que d'habitude, on ne les changera pas) en aient pris ombrage, et exigé la suppression du graphique considéré par eux comme une "attaque" (ah, sûrement, un graphique en log-log, c'est comme une courbe de températures ou les cours de la Bourse, ils ne peuvent y voir qu'une attaque)


Le graphique est à la disposition de ceux qui le demanderont dans ma BAL. Disons simplement qu'il donne raison à Mandelbrot plus qu'à Zipf.

609844 Publié le 14/05/2004 à 10:22 supprimer cette contribution
L'aigrie, c'est MOI !!!

parce que j'en ai marre.
Vous deviez vous ennuyer une fois de plus Monsieur Paganel, vous deviez être en manque de "frictions", pour une fois encore vous en prendre au vrac, et à celles et ceux qui l'aiment.

Et je n'avais pas demandé l'unique suppression du graphique, mais tout ce qui se rapportait à votre étude, que je juge malsaine.
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 10:28 supprimer cette contribution
Citation:
L'aigrie, c'est MOI !!!
Je n'en suis qu'à moitié surpris.
Citation:
parce que j'en ai marre.
Lexomil. C'est plus efficace que de s'en prendre au monde entier quand on se sent mal. Mal auquel je ne suis pour rien.
Citation:
Vous deviez vous ennuyer une fois de plus Monsieur Paganel, vous deviez être en manque de "frictions", pour une fois encore vous en prendre au vrac, et à celles et ceux qui l'aiment.
Mon analyse a porté sur le premier fil ayant une taille de plus de 250 pages, afin d'avoir un échantillon d'analyse qui se tienne.
Citation:
Et je n'avais pas demandé l'unique suppression du graphique, mais tout ce qui se rapportait à votre étude, que je juge malsaine.
Des centaines de ce genre sont faites chaque année. Ce système de défense ne te mène nulle part.

Tiens, voici des images dont on espère que tu n'y verras pas des "attaques". Bien que :


Sûr que c'est sacrément plus intéressant pour les lecteurs, ton affaire ! Et que ça en motive plus d'un à fréquenter le lieu


Encore un pt'it , ma sister ?
609844 Publié le 14/05/2004 à 10:35 supprimer cette contribution
Citation:
Ce système de défense ne te mène nulle part


Il ne s'agit pas là d'un système de défense, juste une constatation. J'émets un point de vue qui n'engage que moi.
Nous ne sommes pas devant un tribunal que je sache. Ceci en restera là, je ne ferai pas "appel" puisque les instances divines en ont décidé ainsi.
Et puis dans le fond... si cela vous amuse, pourquoi pas ???


Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 10:43 supprimer cette contribution
Citation:
Il ne s'agit pas là d'un système de défense, juste une constatation. J'émets un point de vue qui n'engage que moi.
Si c'est un point de vue, ce n'est pas une constatation. Si c'est une constatation, ce n'est pas un point de vue.

C'est le problème avec vous autres : vous vous piquez d'utilisez une langue, alors que vous ne faites rien pour la maîtriser. Pour les poèmes, c'est pareil. Et pour vos vies, mon petit doigt me dit que c'est pareil aussi : absence d'exigence envers les autres et soi-même, voilà le résultat.

Mais bon, chacun la sienne. Bon vent !
539788 Publié le 14/05/2004 à 10:44 supprimer cette contribution
On a toujours dit si on parle de ce que tu fais c’est qu’on s'intérèse à toi
Que se soi en compliment ou en critique, elle te fond connaître
C’est une façon dire que l’on t’apprécie
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 10:51 supprimer cette contribution
Soyons francs, Ariel : Tout ce que je demande à certains, c'est justement au contraire de m'oublier. Il y a suffisamment ici de gens intéressants avec qui correspondre et de sujets passionnants à traiter pour qu'on perde en plus du temps à contrer les manoeuvres des malcomprenants, aigris et paranos de tout poil. Pour eux, tout ce qui monte un peu au-dessus du niveau des paquerettes, qu'il s'agisse de science ou de poésie, devient "agression".

Je n'y peux rien si les miroirs leurs renvoient une image qu'ils n'aiment pas. Ce n'est pas la faute des miroirs.

Où irait-on si tout un chacun allait dans leur propre ghetto faire censurer toute insulte - réelle, cette fois-ci - à la langue française et à la poésie !
609844 Publié le 14/05/2004 à 10:54 supprimer cette contribution
Citation:
Tout ce que je demande à certains, c'est justement au contraire de m'oublier


Alors oubliez ceux du vrac en n'y faisant pas référence !
A bon entendeur........
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 11:15 supprimer cette contribution
Eh bien je prépare justement une suite.

À ce soir sur nos lignes, une fois que ma machine aura mouliné.

Pour le reste, je garde ma liberté d'expression, et tant pis si ça donne des boutons à certains Tout ce qui s'offre à nos yeux devient légitimement objet potentiel d'étude. Si vous avez si honte du vrac (je vous comprends), cachez-le.
609844 Publié le 14/05/2004 à 11:16 supprimer cette contribution
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 12:34 supprimer cette contribution
Hop ! Si le graphique ci-dessous n'est pas censuré, cela signifiera que les gazettistes, eux, ne sont pas idiots :



En abscisses : Log du rang d'un mot
En ordonnées : Log de son nombre d'occurrences

Rappelons que pour Zipf ça doit ressembler à une droite, et pour Mandelbrot (démonstration à l'appui) à une courbe comportant un coude vers le bas.

On voit ici ce coude vers l'ordonnée de valeur 4.
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 12:42 supprimer cette contribution
Citation:
veuillez enlever cela immédiatement !!!!
Voilà qui est fait
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 13:22 supprimer cette contribution
Sur des tranches d'âge et des langues, oui. Dans la loi de Mandelbrot, le coefficient "c" est dans la fourchette 1,1-1,2 pour à peu près toutes les langues, et voisin en revanche de 1,6 pour le langage des enfants.

Mon programme permet d'effectuer des analyses par pseu pour un fil donné, et il serait en effet intéressant de comparer les courbes de Mandelbot de tout un chacun. Toutefois, tant que je ne dispose pas d'une méthode me permettant de déterminer de façon rationnelle b et c à partir d'un corpus, nous ne pourrons pas faire grand chose de visible du résultat .

Alors s'il y a un ingénieur dans la salle...

(En ce qui concerne un fil, il est en effet assez hardi de supposer qu'il possède à travers ses membres une sorte de mémoire collective utilisée elle aussi de façon optimale, mais là, je prends le risque; après tout, il existe bien une communauté de sujet dans un fil)
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 14:27 supprimer cette contribution
Citation:
paganel, tu n'as pas mis les mots correspondants au graphique que tu viens de nous soumettre
Je ne voulais pas encombrer, mais les voici (ce que femme veut... ! )

Rappelons que je n'ai collecté que les mots de plus de 3 lettres. On trouve donc "aujourd", mais pas "hui" (Perl a sa notion de ce qu'est un séparateur de mots, mais on peut heureusement la modifier le moment venu).
Citation:
152 pour
126 mais
99 dans
85 plus
76 tout
71 tous
69 bien
66 elle
62 amour
61 avec
57 automobiles
56 dora
56 fait
56 vous
54 nous
50 suis
49 merci
49 faire
45 aussi
44 anniversaire
43 citation
43 alors
39 franky
38 peut
37 sais
36 comme
36 forum
34 francky
33 bonne
32 toutes
32 encore
31 sont
29 être
29 xiane
26 même
26 était
26 rien
26 photo
25 affection
23 quand
22 cette
22 déjà
21 avoir
21 vais
21 toujours
21 salut
20 gazette
20 voir
20 photos
19 autres
19 dire
19 lasme
18 tarentino
18 viens
18 milady
18 quoi
18 cela
18 trop
17 petit
17 autre
17 jour
17 jamais
16 ébène
16 très
16 juste
16 faut
16 monde
16 mettre
16 image
16 lire
16 aujourd
16 frank
16 post
16 comment
16 franck
16 retour
15 nouvelle
15 peux
15 aime
15 crois
15 tiens
15 enfin
15 temps
15 veux
15 ebène
15 album
15 super
15 nbsp
14 ariel
14 maintenant
14 sans
14 santino
14 avais
14 tête
14 avait
14 personne
13 aller
13 http
13 fiche
13 savoir
13 deux
13 journée
13 raison
13 belle
13 texte
13 donc
13 adresse
13 forums
12 musetta
12 message
12 vois
12 leur
12 beau
12 blutgeld
12 site
12 quelque
12 petite
12 pense
12 coucou
12 rochester
12 mieux

595300 Publié le 14/05/2004 à 14:32 supprimer cette contribution
Tiens, tu analyses le fil sur La Gazette d'Affection, maintenant?
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 14:39 supprimer cette contribution
Citation:
je pense que ce n'est pas la richesse du vocabulaire que l'on cherche à déterminer mais bien l'organisation de ce vocabulaire au travers de cette analyse du nombre d'occurences.
Exact. Cela dit, on peut en effet en sous-produit de cette analyse avoir une idée de l'étendue du vocabulaire de quelqu'un : il suffit de prolonger la droite qui est derrière le coude et de regarder où elle coupe l'axe. Une beauté de la chose est que ça marche même avec un échantillon de quatre pages, mais n'en faisons-nous pas autant machinalement en lisant une lettre dont nous connaissons mal l'expéditeur ?

Une autre beauté de la chose est que les mots utilisés eux-mêmes ne comptent pas. À une époque (vers 1979, je crois), les rédacteurs du Nouvel Obs s'éteint entichés du mot "hiératique" et le plaçaient à tout bout de champ dans leurs articles. Toutefois, pour une analyse de Mandelbrot, le mot ne compte pas plus que si on avait utilisé à la place "chouette" ou "super" : la répartition des fréquences seule compte, non les mots eux-mêmes : on ne peut pas faire illusion.

Citation:
je veux dire que si l'on effectue des comparaisons entre deux populations l'une avec un vocabulaire pauvre et l'autre avec un vocabulaire riche, ces deux peuvent présenter un profil similaire quant à la structuration, l'organisation de leur corpus.
De toute façon, oui, mais pas nécessairement avec les mêmes valeurs pour b et c. Si on parle en "basic english", mon avis est qu'une partie beaucoup plus grande du vocabulaire sera répétée fréquemment.
Citation:
c'est à dire que quel que soit la richesse de mon vocabulaire je vais organiser mon discours ou choisir mon vocabulaire d'une manière qui peut être reproduite selon un modèle quasiment constant.
Apparemment oui. Et si on s'intéresse à nouveau aux mots, voir quels nouveaux remplacent quels anciens peut se révéler une indication précieuse sur le cours que prend une vie
792115 Publié le 14/05/2004 à 14:48 supprimer cette contribution


Ces assez troublant cette "loi de Zipf-Mandelbrot"
Les mots utilisés dans nos quotidiens relatent seulement les acquis, l’éducation reçue, le milieu de vie, le nombre de mot emmagasiné varie selon les utilisateurs je crois, une statistique générale du site peut s’avérer intéressante mais plus intéressante encore vis-à-vis d’un individu, déjà utilisé ds un autre forum si je ne me trompe !!!
Certaine expression, mots, reviennent machinalement utilisé à profusion, puis chose intéressante aussi les nouveaux mots entendus ou lu, à exploiter à la première occasion qui se présente.

Je me demande quelle est la capacité maximale d’information d’un cerveau, mais vu que la mémoire est sélective pour certaine chose cela doit être assez difficile à évaluer...
A mon humble avis d’inculte !!!! la capacité d’un cerveau ne varie pas bcp entre les êtres humains ni le sexe d’ailleurs, Mais il a pollution dans la mémoire c à dire :
Certains vont enregistrer des évènements du quotidien, d’autres des informations utiles
Mais cette pollution émotionnelle emmagasinée porte préjudice à l’acquis intellectuel, donc si un individu abrutis par des informations émotionnelles dans un milieu social néfaste, une grande partie des informations reçue ne seront qu’émotionnelle ( souvenirs ) et la partie intellectuelle réduite bien entendu.
Un exemple troublant d’un serial killer ( le nom m’échappe malheureusement mais bcp de profils se ressemblent chez eux ) ce personnage avait pourtant vécu une enfance horrible, mais ne ressentait aucun sentiment, un blocage émotionnel depuis cette enfance, il était pourvu d’après les psychiatre d’un QI au-delà de la moyennes, et mon petit doigt me dit que ce manque n’y est pas étranger.
Paganel, antisémantique - 980920lui écrire blog Publié le 14/05/2004 à 16:36 supprimer cette contribution
Citation:
tu pourrais avec ta moulinette, recouper les mots identiques d'un fil à l'autre ?
Non, mais je pourrais en écrire une autre

Burton : Tiens, Paganel se met à travailler à l'américaine : au coup par coup, sans plan d'ensemble. Où est passée la "french touch"?
1078778 Publié le 31/05/2004 à 01:58 supprimer cette contribution
Voila un échange bien sympatique, cela me fait penser à la troisième loi de Newton.
Paganel, antisémantique - 980920lui écrire blog Publié le 31/05/2004 à 22:46 supprimer cette contribution
Moi, à la thermodynamique. f(i) = a / i (Zipf) évoque la loi des gaz parfaits. f(i) = a (b+i)^-c évoque la loi des gaz réels, où l'on tient compte du fait que les molécules occupent un volume.

Choes plus curieuse encore, cette loi de Zipf est une loi d'entropie maximale : celle qui est le moins arbitraire sous la contrainte log(N)= constante (C'est à dire : "on connait l'ordre de grandeur du vocabulaire"). Elle constituerait donc un bon candidat comme distribution a priori même si elle n'était pas exacte. Etrange, et bien dans la lignes de "lois stables" de Paul Lévy.

http://www.google.fr/search?num=30&hl=fr&ie=UTF-8&lr=lang_en|lang_fr&q=%22loi+d%27entropie+maximale%22&spell=1
Page 1

Forums > Sciences Ecrire une contribution Retour au début de la page


<< Précédent | La loi de Zipf-Mandelbrot| Suivant >>

Accueil | Conditions générales | FAQ | Contact | Créé par CAPIT
 Accueil
 Mon Menu Perso
 Rencontre
 Messagerie
 Chat
 Espace membre
 Expressions
Forum
 Net Etiquette
 Vos forums
 Charte utilisation
 Derniers posts
 Rechercher
 Forums favoris
 Modération
 Mode d'emploi
 Santé
 Sexualité
 Mariage
 Astrologie
 Jeux
 Voyager
 Humour
 Editorial
3 connectés au chat
9 connectés au total
Consulter l'annonce
ajouter aux favoris La loi de Zipf-Mandelbrot