Seite 3 von 4
Re: "Statistiker" gesucht
Verfasst: So Mär 08, 2009 8:50 pm
von Tetra
hab mal ein bischen an einem PRogram das ich mal für die Uni brauchte umgeschreiben. War zwar etwas mehr Arbeit als gedacht, kann aber unter:
http://picasaweb.google.com/Christian.B ... auswertung# angeschaut werden
Re: "Statistiker" gesucht
Verfasst: So Mär 08, 2009 9:58 pm
von js
Hm, das sind auch gute Bilder. Müsste man dann allerdings pro CN-Wert haben.
Re: "Statistiker" gesucht
Verfasst: So Mär 08, 2009 10:11 pm
von Tetra
was meinst du mit pro cn wert?
Re: "Statistiker" gesucht
Verfasst: So Mär 08, 2009 10:14 pm
von js
Na jeder Datensatz enthält doch auch einen CN-Wert. (Datensatz=Alle Daten mit gleichem Zeitstempel)
Re: "Statistiker" gesucht
Verfasst: So Mär 08, 2009 10:18 pm
von Tetra
willst du also die Daten irgendwie zusammen gemischt haben mit dem cn wert oder wie? Weil sonst würde der Graph 8-Dimensonal sein (für jede Richtung eine Dim. und dann noch wie oft dieser vorkommt) und das kann mein einfach schlecht Zeichen
(Es existiert auch ne eingene Graphik für den cn wert)
PS: ich hab leider keine Ahnung was diese Daten bedeuten, also wenn ich die zusammen mischen soll, musst du mir sagen wie. (Das zumachen ist kein Porblem)
Re: "Statistiker" gesucht
Verfasst: So Mär 08, 2009 10:24 pm
von js
Es gibt vermutlich 3 oder 4 verschiedene CN-Werte und es soll für jeden ein eigener Graph entstehen.
Die Daten, wie sie in dem File stehen, sind die entstandenen Logfiles und in keinster Weise irgendwie aufbereitet. D.h. jeder Datensatz besteht auf verschiedenen Werten mit unterschiedlichen Bedeutungen:
der Zeit - 1. Achse
dem AVG-Werten - jeweils 2. Achse
dem CN-Wert - 3. Achse
Vielleicht hatte Seefeld da doch recht, dass man darüber noch etwas mehr hätte reden müssen. Aber eben nicht über das aussehen, sondern die Bedeutung der Werte.
Da die 3. Achse in der Regel eher schlecht zu lesen ist, sollen eben für jede 3. Ebene ein eigener Graph entstehen.
Re: "Statistiker" gesucht
Verfasst: So Mär 08, 2009 10:45 pm
von Tetra
Also es gab, ohne es genau nachzuprüfen, 4 cn Werte (bei 1,2,4 und 1355)
Für diese Werte, sollen jetzt einzelnd der Zeitpunkt ermittelt werden? (Ist damit Datum, Uhrzeit, We/Werktag gemeint?)
Die jeweiligen cn Werte soll jeweils ein Diagram für Afg1-Counts, eines für Afg2-Counts usw. erstellt werden?
Sollen die Graphen wieder als Histogram (so heist die verwendete Darstellung) genommen werden?
Re: "Statistiker" gesucht
Verfasst: So Mär 08, 2009 11:26 pm
von js
Nein, der Zeitpunkt muss nicht ermittelt werden, der dient im ersten Anlauf nur um die Werte (cn und Rest) zuordnen zu können.
CN kann nur Werte zwischen 1 und 4 haben, 1355 ist ein Fehler. CN entspricht der CPU-Zahl.
Histogramm wäre super.
Im zweiten Anlauf wäre dann ein Bild mit avg0 im Median gegen die Zeit, da ist die CN egal bzw. wenn, wäre das als 3. Achse vielleicht denkbar.
Zusammengefasst:
- pro avg0..avgX und pro CN als dieses Histogramm
- avg0 gegen die Zeit und evtl. cn, keine Ahnung, welche Art von Graph, vielleicht dieses Balkendiagramm, das ich vorgeschlagen hatte, vielleicht gibts was besseres
Re: "Statistiker" gesucht
Verfasst: So Mär 08, 2009 11:36 pm
von Tetra
js hat geschrieben:
CN kann nur Werte zwischen 1 und 4 haben, 1355 ist ein Fehler. CN entspricht der CPU-Zahl.
Histogramm wäre super.
Das ist kein Problem
js hat geschrieben:
- pro avg0..avgX und pro CN als dieses Histogramm
Das sollte kein Problem sein
js hat geschrieben:
- avg0 gegen die Zeit und evtl. cn, keine Ahnung, welche Art von Graph, vielleicht dieses Balkendiagramm, das ich vorgeschlagen hatte, vielleicht gibts was besseres
Das ist glaube ich eines. Wäre gut wenn die Daten zeitlich sortiert sind und einigermaßen feste zeitliche Abstände vorhaneden sind... Weiß leider grade nicht, ob ich das so einfach machen kann. (Benutze Mathematica).
Re: "Statistiker" gesucht
Verfasst: Mo Mär 09, 2009 8:15 am
von js
Tetra hat geschrieben:
Das ist glaube ich eines. Wäre gut wenn die Daten zeitlich sortiert sind und einigermaßen feste zeitliche Abstände vorhaneden sind... Weiß leider grade nicht, ob ich das so einfach machen kann. (Benutze Mathematica).
Naja, sind halt Messwerte, die fallen an, wenn jemand etwas gemacht hat.
Würde dir vielleicht noch die Dauer eines Datensatzes helfen um so vielleicht die Gewichtung der avg zu deuten?
Vielleicht hilft dir auch diese Information, um ein paar weitere nette Graphen zu erzeugen, die etwas aussagen:
cn ist wie gesagt die CPU-Zahl, die Dauer könnte ich noch liefern, die dann der Laufzeit entspricht, in der die avgs gesammelt wurden.
avg[0] ist in etwa die Summe aller avg[1-4], aber nicht 5. In etwa, da auch avg0 gemessen wird.
Mich interessiert nun eben, wie sich einerseits die CPU-Zahl auf die AVGs auswirkt und andererseits, wie sich die avgs im Laufe der Zeit verändert haben, da es u.a. Codeänderungen gegeben hat, die diese Werte verringern sollten.
Jedenfalls schonmal danke an alle, die da bereits aktiv sind oder waren. Ich glaube, so langsam kommen wir auf Darstellungen, die etwas aussagen. Sicherlich sind die von mir vorgeschlagenen Balkendiagramme nicht unbedingt optimal, wenn also noch andere Arten rausfallen, die brauchbar sind, nur zu.
Re: "Statistiker" gesucht
Verfasst: Mo Mär 09, 2009 12:51 pm
von Tetra
Mich interessiert nun eben, [...] wie sich die avgs im Laufe der Zeit verändert haben, da es u.a. Codeänderungen gegeben hat, die diese Werte verringern sollten.
Also ist der Datumsablauf wichtig? Also am 2008-10-17 angefangen und dann am 2009-02-28 aufgehört? (Also nicht um wieviel Uhr welcher avg0 auftritt.)
@edit: versuch das mit dem Avg Diagrammen nach der cn Zeit mal heute Abend zu machen...
Re: "Statistiker" gesucht
Verfasst: Mo Mär 09, 2009 12:58 pm
von js
Ja, nur der Tagesverlauf.
Re: "Statistiker" gesucht
Verfasst: Mo Mär 09, 2009 3:09 pm
von Tetra
so hab mal die cn - abhängigen Daten gemacht. (Werde aber nicht jedes einzelne Bild extra hochladen. Ist mir zuviel Arbeit das auseinander zu nehmen. Hab aber trotzem ein paar zur Ansicht
hier)
Hab die Bilder alle zusammen in ne PDF-Datei gepakt und bräuchte mal ne Mail-addresse zum verschicken.
Für den Tagesverlauf hab ich zwar ne Idee wie es gehen könnte doch hab ich jetzt nciht mehr genug Zeit dafür...
Re: "Statistiker" gesucht
Verfasst: Mo Mär 09, 2009 3:31 pm
von js
Muss ja nicht sofort sein, hat ja schon noch einige Tage Zeit. Allerdings verstehe ich auch Bild 8 und 9 nicht. Was sehe ich da auf den Achsen (X/Y)?
Re: "Statistiker" gesucht
Verfasst: Mo Mär 09, 2009 3:45 pm
von Tetra
x-Achse ist immer die höhe des Avg-wertes (hier ist das der Avg0-Wert) und y-ist die Anzahl, wie oft dieser Wert auftritt.
@edit:
Im Titel, also oben über der Graphik steht drin, für welchen cn-Wert und werlchen Avg-Wert das gilt. (das my gibt das Arithmetische Mittel wieder und das Sigma die Standardabweichung, min den minimalsten Avg-Wert, max den maximalen Wert, Totalcounts die absulute Anzahl der avg-Werte)
(kann nachher nochmal die Axen beschriften...)
btw. bräuchte dann noch ne Mail-Addresse. (auch gerne als pn) Oder soll ich einfahc an
admin@js-home.org schicken?
@edit 2: kann auch die relative Häufigkeit angeben lassen. (Also in Prozenten)