<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Arbeitszimmer &#187; Netzwerkanalyse</title>
	<atom:link href="http://arbeitszimmer.statistik-peter.at/category/netzwerkanalyse/feed/" rel="self" type="application/rss+xml" />
	<link>http://arbeitszimmer.statistik-peter.at</link>
	<description>Statistik Weblog von Wolfgang Peter</description>
	<lastBuildDate>Sat, 19 Nov 2011 18:24:23 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Netzwerkanalyse I</title>
		<link>http://arbeitszimmer.statistik-peter.at/2008/03/30/netzwerkanalyse-i/</link>
		<comments>http://arbeitszimmer.statistik-peter.at/2008/03/30/netzwerkanalyse-i/#comments</comments>
		<pubDate>Sun, 30 Mar 2008 10:50:10 +0000</pubDate>
		<dc:creator>Wolfgang Peter</dc:creator>
				<category><![CDATA[Netzwerkanalyse]]></category>
		<category><![CDATA[Inhaltsanalyse]]></category>

		<guid isPermaLink="false">http://arbeitszimmer.statistik-peter.at/2008/03/30/netzwerkanalyse-i/</guid>
		<description><![CDATA[Auf der diesjährigen GOR besuchte ich den Workshop &#8220;Extraction of Relatoional Datd from Text&#8221; von Jana Diesner. Ich hatte im Zuge des Workshops Gelegenheit mich mit dem Thema auseinanderzusetzen. Hier meine Kurzzusammenfassung: Netzwerkanalyse beschäftigt sich mit den Beziehungen komplexer Systeme zueinander. Dabei kann es sich um soziale Netzwerke und deren Zusammenhänge mit Unternehmensstrukturen oder auch [...]]]></description>
			<content:encoded><![CDATA[<p>Auf der diesjährigen <a href="http://www.gor.de/gor08/index.php">GOR</a> besuchte ich den Workshop &#8220;Extraction of Relatoional Datd from Text&#8221; von <a href="http://www.andrew.cmu.edu/user/jdiesner/">Jana Diesner</a>. Ich hatte im Zuge des Workshops Gelegenheit mich mit dem Thema  auseinanderzusetzen. Hier meine Kurzzusammenfassung:<br />
Netzwerkanalyse beschäftigt sich mit den Beziehungen komplexer Systeme zueinander. Dabei kann es sich um soziale Netzwerke und deren Zusammenhänge mit Unternehmensstrukturen oder auch um technische Zusammenhänge wie z.B. die Wirkung von Medikamenten handeln. Eine weiter Anwendung habe ich kürzlich in der Zeitschrift &#8220;der Standard&#8221; gefunden (Printausgabe, vom Freitag, 28. März 2008). Dabei wurden die Spiele der österreichischen Nationalmannschaft netzwerkanalytisch ausgewertet.</p>
<p>Der klassische Ansatz Texte zu analysieren ist die Content-Analyse. Die Inhalts-Analyse ist eine von einer Hypothese geleitete Methode. Bei der  theoriegeleitet ein Kategoriensystem (Codebook) entwickelt wird und Häufigkeiten (händisches auszählen) im Text identifiziert werden, die im Anschluss entweder statistisch oder mittels Graphen dargestellt werden. Der Nachteil dieser sehr verbreiteten Methode ist, dass alles in Handarbeit von Experten des entsprechenden Themengebiets analysiert werden muss, was Zeitaufwendig ist. Es gibt zwar recht gute (teure) Software wie zB <a href="http://www.atlasti.com/de/">ATLAS.ti </a>das auf der Grounded Theory aufbaut trotzdem lassen sich extrem große Textmengen nicht optimal analysieren.<br />
<img src='http://arbeitszimmer.statistik-peter.at/wp-content/graph.jpg' alt='Netzwerkanalyse' /><br />
<em>Grafik von http://statnetproject.org/</em><br />
Ein anderer Weg ist softwaretechnisch das Auszählen und Bewerten der Texte zu realisieren. Die Methoden und Theorien hinter der &#8220;Software&#8221; sind NLP (Natural Language Processing), IE (Informations Extraktion) und Network Analysis of complex Systems.<br />
Im ersten Schritt werden die Daten reduziert, indem Wörter ohne inhaltliche Bedeutung entfernt werden.<br />
Das Zipf&#8217;s Law stellt einen indirekten Zusammenhang zwischen Wort-Häufigkeit und Bedeutung des Wortes auf. Also Worte die häufig vorkommen, haben keine Bedeutung, sie können demnach weggelassen werden. Es gibt allerdings keine Theorie die belegt, dass Wörter wie &#8220;die&#8221;, &#8220;aber&#8221; die häufig im Text vorkommen, keine Bedeutung besitzen &#8211; was die Kritik an der Methode darstellt. </p>
<p>Nächster Schritt zur Reduktion der Daten ist eine Normalisierung der Wörter und das Zurückführen auf den Wortstamm.</p>
<p>Mit einem so aufbereiteten Text können die Häufigkeiten von Wörtern berechnet oder die Term Frequenz (Wichtigkeit von Termen im Dokument) oder die Inverse Document Frequency berechnet werden. Auch lässt sich auf Basis eines reduzierten Datensatzes die Entropy eines Textdokumentes im Kontext zum Gesamtdatensates quantifizieren (Aussagekraft der Textes).</p>
<p>Softwareprodukte sind zum Beispiel die Module <a href="http://erzuli.ss.uci.edu/R.stuff">sna </a>und <a href="http://statnetproject.org/">network </a>für die Sttistiksoftware R oder das von Jana programmierte <a href="http://www.casos.cs.cmu.edu/projects/automap/index.html">Automap </a>weitere findet man auf wikipedia.org <a href="http://en.wikipedia.org/wiki/Social_network_analysis_software">Social network analysis software </a>.</p>
<p>Fortsetzung folgt&#8230;</p>
<iframe src="http://www.facebook.com/plugins/like.php?href=http%3A%2F%2Farbeitszimmer.statistik-peter.at%2F2008%2F03%2F30%2Fnetzwerkanalyse-i%2F&amp;layout=standard&amp;show_faces=true&amp;width=450&amp;action=like&amp;colorscheme=light&amp;height=80" scrolling="no" frameborder="0" style="border:none; overflow:hidden; width:450px; height:80px;" allowTransparency="true"></iframe>]]></content:encoded>
			<wfw:commentRss>http://arbeitszimmer.statistik-peter.at/2008/03/30/netzwerkanalyse-i/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

