Рефераты. Контент анализ экономической    информации
Контент анализ экономической информации

Контент анализ экономической информации

Контент анализ экономической информации


МИНИСТЕРСТВО ВЫСШЕГО И  ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ИРКУТСКАЯ   ГОСУДАРСТВЕННАЯ   ЭКОНОМИЧЕСКАЯ    АКАДЕМИЯ
Центр Психологии
КУРСОВАЯ
РАБОТА
по  Психологии управления
на тему:
Контент-анализ  экономической  информации
            Выполнил:                                                                                         Проверил:
            студент
М-95-1                                                                                 к.п.н.
            Четвериков
С.                                                                                  Вяткин
А.П.
Иркутск, 1999
ВВЕДЕНИЕ
                        Через
один год  обозреватели и журналисты
будут гадать,  каким  символом обозначить уходящий век.  Уже предложено несколько названий: атомный
век,   электрический, космический,  информационный.  Думаю,  на этот вопрос не
может быть однозначного ответа, так как столетие – это не один миг, оставляющий
только одно впечатление в   сознании
человеке. Это – путь эволюции  всего
человечества: от удовлетворения своих потребностей   в пище и  крове над
головой,  облегчения быта и труда
до  удовлетворения интеллектуальных
потребностей  каждого человека в  знаниях, самовыражении, образовании.  До недавнего времени возможности такого  образования были ограничены   наличием печатной литературы,   близостью культурных и научных
центров,  скоростью чтения читателя. Но
с появлением электронных средств коммуникации становится все больше способов
получения информации.  Достаточно  иметь доступ в Internet, чтобы  бесплатно получать оперативную информацию о
происшествиях в мире, состояниях рынков, настроениях  общественности.  Также
существует много  платных информационных
агентств:  Сибирское Информационное
Агентство (СИА), АК&М,
Прайм-ТАСС, РосБизнесКонсалтинг; из иностранных это прежде всего REUTERS, TeleForm, DowJones Telerate, Bloomberg, CNN.  Эти компании поставляют информацию в режиме
"реального  времени", то есть
как только она становится известна репортерам агентства, вы получаете ее на ваш
компьютер. Из-за большой сети  бюро этих
агентств поток информации  в последнее
время  стал превышать   адаптационные возможности человека:  один даже специально подготовленный
сотрудник не может отследить весь поток информации на интересующую его тему,
настолько он велик.  В связи с этим  стала 
насущной  задача создания
такого     метода автоматической
обработки данных, который позволил бы 
без ущерба для целостности 
информации  выделять только
главные компоненты  сообщения, то есть
формировать "доминанту" текста. Одной из практических разработок,
способных  выполнять такую работу с
текстом, является метод  контент-анализа.    Создание компьютерных программ на основе
контент-анализа  позволит     автоматически резюмировать поток  новостей, 
отфильтровывать   основные –
главные- новости по определенному пользователем контексту, будь то информация о
политике, экономике, рынке акций или валюты, 
новых разработках в компьютерной сфере или другое.  Отсюда и берет начало название метода: как
пользователь задаст значимость контекста искомых понятий, так он и будет
получать результат.  
            В
рамках этого курсового проекта  я
рассмотрю историю проблемы обработки текстовой информации,   опишу найденную мной методику проведения
контент-анализа, а также приведу пример проведения  контент-анализа, взятый мной из экономического журнала.
ИСТОРИЯ  
ПРОБЛЕМЫ
Îäíîé
èç
èíòåíñèâíî
ðàçâèâàþùèõñÿ
îòðàñëåé
èñïîëüçîâàíèÿ
ìàøèíî÷èòàåìûõ         
ïèñüìåííûõ
èñòî÷íèêîâ
â öåëÿõ õðàíåíèÿ
è îáðàáîòêè
ÿâëÿåòñÿ
ïðèìåíåíèå         
ñåìàíòè÷åñêèõ
ÿçûêîâ
ðàçìåòêè òåêñòà.
Ïåðâîíà÷àëüíî
ïîíÿòèå
ðàçìåòêè
òåêñòîâ èñïîëüçîâàëîñü
äëÿ          
îïèñàíèÿ
ññûëîê è
äðóãèõ
îòìåòîê â
òåêñòå êàê
èíñòðóêöèÿ
äëÿ
íàáîðùèêà
èëè          
ìàøèíèñòêè
ïî ïðàâèëàì
ïå÷àòè è
îôîðìëåíèÿ.
Ïîñëå òîãî,
êàê
ñîçäàíèå
òåêñòîâ          áûëî êîìïüþòåðèçирîâàíî,
ïîíÿòèå
ðàçìåòêè
áûëî
ðàñøèðåíî
äëÿ îáîçíà÷åíèÿ
âñåõ         
êîäîâ,
âñòàâëåííûõ
â
ýëåêòðîííûå
òåêñòû äëÿ
óïðàâëåíèÿ ôîðìàòèðîâàíèåì,         
ïå÷àòüþ è
ïðî÷èìè
âèäàìè
îáðàáîòêè. Â
ýòîì ñìûñëå
ðàçìåòêà
ÿâëÿåòñÿ
êîäèðîâêîé          äëÿ
ÿñíîãî
óêàçàíèÿ íà
òî, êàê
ñëåäóåò
ïîíèìàòü
òåêñò.
Óäîáñòâî
äàííîãî
âèäà         
ðàáîòû ñ
ýëåêòðîííûìè
òåêñòàìè
ñîñòîèò â
òîì, ÷òî
ìîæíî èçìåíÿòü
êîäû áåç         
èçìåíåíèÿ
èñòî÷íèêà.
ßçûê
ðàçìåòêè
óêàçûâàåò
ïðàâèëà
êîäèðîâàíèÿ
äîêóìåíòà,         
ïðàâèëà îòëè÷èÿ
çíàêîâ êîäà
îò çíàêîâ
òåêñòà è ÷òî
êîäû
îçíà÷àþò.
Âñå ÿçûêè         
ðàçìåòêè
îñíîâàíû íà
òðåõ
îñíîâíûõ
ïîëîæåíèÿõ. 
         
Âî-ïåðâûõ,
íà ñàìîì
ïðèìèòèâíîì
óðîâíå âñå
òåêñòû áåç
èñêëþ÷åíèÿ
ñîñòîÿò èç         
ëèíèé
ñèìâîëîâ.
Íàïðèìåð, èç
áóêâ èëè
áàéòîâ äàííûõ,
ïîìåòîê íà
ñòðàíèöàõ
èëè         
ãðàôèêè.
Îíè
ïîëó÷èëè
íàçâàíèå
"ÿâëåíèÿ". Ïî ñóòè,
ýòî
ìèíèìàëüíàÿ
÷àñòèöà
òåêñòà          òèïà
ñëîâà èëè
òî÷êè,
ðàññìàòðèâàåìàÿ
âíå
çàâèñèìîñòè
îò
ñòðóêòóðíîé
èëè         
êàòåãîðèàëüíîé
êëàññèôèêàöèè.
 áàçå
äàííûõ èç
ñâîáîäíîãî
òåêñòà
"ÿâëåíèÿ"          ïðåäñòàâëåíû
íàáîðîì
áàéòîâ äëÿ
õðàíåíèÿ è
îáðàáîòêè. 
         
Âî-âòîðûõ,
íà
ñëåäóþùåì
óðîâíå àáñòðàêöèè
âñÿêèé
òåêñò
ðàññìàòðèâàåòñÿ
êàê          
ñîâîêóïíîñòü
îáúåêòîâ
ðàçëè÷íîãî
ñâîéñòâà.
Äàííûå
îáúåêòû
ïîÿâëÿþòñÿ â
òåêñòå         
çàêîíîìåðíî
â îïðåäåëåííîì
îòíîøåíèè ê
ïðî÷èì
îáúåêòàì. Îáúåêòû
ìîãóò          âêëþ÷àòü
äðóã äðóãà, èìåòü
ñâÿçè èëè
áûòü
ïîñëåäîâàòåëüíî
ïðåäñòàâëåíû.
Íà ýòîì          óðîâíå
îïèñàíèÿ
òåêñò
ñîñòàâëåí
èç
ñòðóêòóðíî
îïðåäåëåííûõ
îáúåêòîâ,         
íàçûâàþùèõñÿ
"ýëåìåíòàìè".
Îäíàêî
òåêñòû íå
ÿâëÿþòñÿ
ïðîñòîé
÷åðåäîé ñëîâ
èëè         
áàéòîâ. Îíè
ñîäåðæàò ïðèìåðû
îáúåêòîâ,
òàêèå êàê
ïàðàãðàôû,
çàãîëîâêè,
èìåíà,          äàòû,
ïðåäñòàâëåííûå
ïîñëåäîâàòåëüíîñòüþ
"ÿâëåíèé".
Âñå ñõåìû
ðàçìåòêè         
òåêñòîâ, â
áîëüøåé èëè
ìåíüøåé ñòåïåíè,
íàïðàâëåíû
íà îïèñàíèå
ýòèõ êîìïîíåíòîâ.         
Ðàññìîòðåíèå
ñõåì óêàçûâàåò
ïî êðàéíåé
ìåðå òðè
âàæíûõ
àñïåêòà
òåêñòîâûõ         
îáúåêòîâ,
êîòîðûå íóæäàþòñÿ
â
ðàñïîçíàíèè.
Ïðåæäå âñåãî,
ýòî "ïðîòÿæåíèå"
-         
ïîçèöèè â
òåêñòîâîì
ïîòîêå, íà êîòîðûõ
ôîðìû
îáúåêòà
íà÷èíàþòñÿ
è         
çàêàí÷èâàþòñÿ;
çà íèìè
ñëåäóåò
"òèï" - êàòåãîðèÿ,
êîòîðîé
ïðåäíàçíà÷åíû
ôîðìû         
îáúåêòà,
ïîñëå
êîòîðîé
âîçíèêàåò
"êîíòåêñò" -
ñâÿçè
òåêñòîâûõ
îáúåêòîâ ñ
ôîðìàìè          äðóãîãî
îáúåêòà â
äîêóìåíòå. 
         
Òàêèì
îáðàçîì, è
â-òðåòüèõ,
"òèï äîêóìåíòà"
ïîëó÷àåòñÿ
íà îñíîâå
ãðàììàòèêè,         
îïðåäåëÿþùåé
ïðàâèëà
îáúåäèíåíèÿ
êëàññîâ
òåêñòà.
Ïîäîáíûì
îáðàçîì ïðèðîäà         
òåêñòà
ïðåäñòàâëÿåòñÿ
êàê
óïîðÿäî÷åííàÿ
èåðàðõèÿ
îáúåêòîâ
ñîäåðæàíèÿ.
         
Ðàçëè÷àþòñÿ
äâà
îñíîâíûå
òèïà ÿçûêà
ðàçìåòêè
òåêñòîâ:
ïðîöåäóðíûé
è         
îïèñàòåëüíûé.
Ïðîöåäóðíûé
ÿçûê ñîñòîèò
èç çíàêîâ,
êîòîðûå
èçíà÷àëüíî
ÿñíî         
óêàçûâàëè
íà òî, êàê
ðàçìå÷åííûå
ýëåìåíòû
òåêñòà äîëæíû
áûòü
ðàñïå÷àòàíû.         
Äîêóìåíòû,
ðàçìå÷åííûå
ïðîöåäóðíûì
ÿçûêîì,
îáûêíîâåííî
èìåþò
íà÷àëüíóþ         
ñåêöèþ, çàãîëîâîê,
êîòîðûé
èíîãäà
õðàíèòñÿ â
îòäåëüíîì
ôàéëå.
Çàãîëîâîê         
îïðåäåëÿåò
õàðàêòåð
çíàêîâ,
äîïóùåííûõ
äëÿ îïèñàíèÿ òåêñòà,
è çíà÷êè,         
óêàçûâàþùèå
íà îòëè÷èå
çíàêîâ
ïðîöåäóðíîãî
ÿçûêà îò
òåêñòà
èñòî÷íèêà-
îðèãèíàëà.
          Â
ïîäàâëÿþùåì
áîëüøèíñòâå
ñëó÷àåâ
èñïîëüçóþòñÿ
çíà÷êè {...}, \...\, <...>.
Çàãîëîâêè         
òàêæå
ìîãóò
ñîäåðæàòü
çàäàííûå ïîëüçîâàòåëåì
óñëîâíûå
ñèìâîëû, ñ
ïîìîùüþ          êîòîðûõ
ñëîæíûå ïîñëåäîâàòåëüíîñòè
çíàêîâ
ïðîöåäóðíîãî
ÿçûêà
ìîãóò         
ñîêðàùàòüñÿ
äëÿ ëåãêîñòè
èñïîëüçîâàíèÿ.
Ïîäîáíàÿ
ðàçìåòêà òåêñòà
òðåáóåò         
ñïåöèàëüíîãî
ïðîãðàììíîãî
îáåñïå÷åíèÿ,
êîòîðîå
èçíà÷àëüíî
ðàçðàáàòûâàëîñü
äëÿ         
èçäàòåëüñêèõ
öåëåé.
Ðàçëè÷èå ìåæäó
ïðîöåäóðíûì
è
îïèñàòåëüíûì
ÿçûêàìè         
çàêëþ÷àåòñÿ
â òîì, ÷òî
îïèñàòåëüíûé
ÿçûê
îïðåäåëÿåò
ñêîðåå
ýëåìåíòû è         
õàðàêòåðíûå
÷åðòû
äîêóìåíòà,
÷åì
ïðîöåäóðû
îáðàáîòêè.
Çàäà÷åé
ýòîãî ÿçûêà          ÿâëÿåòñÿ
îïðåäåëåíèå
ðàçëè÷íûõ
ôåíîìåíîâ â
òåêñòå,
íàïðèìåð,
ïàðàãðàôîâ,          ïðåäëîæåíèé,
äåéñòâóþùèõ
ëèö. Äàííîå
ðàçëè÷èå
îïèñàòåëüíîãî
è
ïðîöåäóðíîãî         
ÿçûêîâ
ðàññìîòðåíî
â ðàáîòàõ
ñïåöèàëèñòîâ
â îáëàñòè
ëèíãâèñòèêè
è êîìïüþòåðíûõ           òåõíîëîãèé,
ãèïåðòåêñòà,
ãèïåðìåäèà,
ãëîáàëüíûõ
êîìïüþòåðíûõ
ñåòåé. 
         
Îñòàíîâèìñÿ
íåñêîëüêî
áîëåå ïîäðîáíî
íà
âûäâèíóòîé
îáùåé
òåîðèè
ðàçìåòêè          
òåêñòà.
Âñÿêèé ðàç,
êîãäà àâòîð
ïèøåò
÷òî-ëèáî, îí
ðàçìå÷àåò
òåêñò. Ê ðàçìåòêå         
îòíîñèòñÿ
ïðîìåæóòêè
ìåæäó
ñëîâàìè,
îòìå÷àþùèå
èõ ãðàíèöû,
çàïÿòûå,         
îòìå÷àþùèå
ãðàíèöû ôðàç
èëè òî÷êè,
îòìå÷àþùèå
ãðàíèöû
ïðåäëîæåíèé.
         
Îáûêíîâåííî,
àâòîð
ïîñòîÿííî
èñïîëüçóåò
äâà òèïà
ðàçìåòêè
òåêñòà â
ðóêîïèñè:          
ïóíêòóàöèîííûé
è ïðåçåíòàöèîííûé.
Ïîä
ðóêîïèñüþ
áóäåì
ïîíèìàòü
ëþáîé âèä         
òåêñòà.
Ïóíêòóàöèîííûé
ÿçûê
ðàçìåòêè
òåêñòà,
íàïðèìåð,
óêàçûâàåò
íà êîíöû          
ïðåäëîæåíèé
ñ ïîìîùüþ
ïðîáåëà.
Ïðåçåíòàöèîííûé
ÿçûê ìîæåò ñîäåðæàòü,
äëÿ          
ñðàâíåíèÿ,
íóìåðàöèþ
ñòðàíèö
ðóêîïèñè.
Ïðèâåäåííûå
äâà òèïà
ðàçìåòêè òåêñòà
íå          
ìîãóò áûòü
èãíîðèðîâàíû
èç-çà òîãî,
÷òî íà íèõ
ïîñòðîåíà
âñÿ ñèñòåìà
åâðîïåéñêîãî          
ïèñüìà,
ðóññêîãî â
÷àñòíîñòè.
Ïóíêòóàöèîííûé
ÿçûê ðàçìåòêè
òåêñòà
ñîñòîèò èç           íàáîðà
ñðåäñòâ, îáåñïå÷èâàþùèõ
ïåðâè÷íóþ
ñèíòàêñè÷åñêóþ
èíôîðìàöèþ
î         
íàïèñàííûõ
âûñêàçûâàíèÿõ.
Èç-çà
îòíîñèòåëüíîé
ñòàáèëüíîñòè
ïóíêòóàöèè
îíà          
äîñòóïíà
äëÿ
áîëüøèíñòâà
÷èòàòåëåé.
Îäíàêî åå õàðàêòåðèçóþò
ñëîæíîñòü â           èñïîëüçîâàíèè
â
çàâèñèìîñòè
îò
ñòèëèñòè÷åñêèõ
âàðèàöèé
àâòîðîâ. Ñîöèàëüíîå          
ðàçíîîáðàçèå
ïóíêòóàöèè
äåëàåò ÿçûê
áîãà÷å, ÷åì
óñëîæíÿåò
êîìïüþòåðíóþ          
îáðàáîòêó
òåêñòà. Ïðåçåíòàöèîííûé
ÿçûê, ïî
ñðàâíåíèþ ñ
ïóíêòóàöèîííûì,
èìååò          
ïîä÷èíåííûé
õàðàêòåð. Ñ
åãî ïîìîùüþ
äåëàåòñÿ
ÿñíîå
ïðåäñòàâëåíèå
òåêñòà. Îí          
âêëþ÷àåò â
ñåáÿ
ãîðèçîíòàëüíûå
è
âåðòèêàëüíûå
ãðàíèöû
òåêñòà,
íîìåðà
òîìîâ è           ñòðàíèö,
öèòàò è
ïðèìå÷àíèé,
à òàêæå
óêàçàíèÿ íà
êîíöû
ñòðàíèö èëè
ñïåöèàëüíûå          
ñèìâîëû.
Ïóíêòóàöèîííûé
è
ïðåçåíòàöèîííûé
ÿçûêè
îòíîñÿòñÿ ê
ðàçðÿäó         
åñòåñòâåííûõ.
Ê ðàçðÿäó
ýëåêòðîííûõ
ÿçûêîâ
ðàçìåòêè
îòíåñåíû
ÿçûêè îïèñàíèÿ          
ïîëíîòåêñòîâûõ
áàç äàííûõ,
õðàíÿùèõ
èíôîðìàöèþ
â
ìàøèíî÷èòàåìîì
âèäå:          
ïðîöåäóðíûé,
îïèñàòåëüíûé,
ðåôåðåíöèàëüíûé
è ìåòàÿçûê.
Ðàçðàáîò÷èêè
òåîðèè          
ñåìàíòè÷åñêèõ
ÿçûêîâ
äåëàëè ñòàâêó,
ïðåæäå âñåãî,
íà èõ
ñîçäàíèå è
èñïîëüçîâàíèå.
         
Óïîìÿíóòûé
ðàíåå
ïðîöåäóðíûé
ÿçûê â
êîìïüþòåðíûé
ñèñòåìàõ
îáðàáîòêè
òåêñòîâ           çàìåíèë
ïðåçåíòàöèîííûé.
Ïðîöåäóðíûé
ÿçûê ÷àñòî
ñòàë
íàáîðîì
êîìïüþòåðíûõ         
êîìàíä,
îïðåäåëÿþùèõ,
êàêèì îáðàçîì
ñëåäóåò
ôîðìàòèðîâàòü
òåêñò â êîíêðåòíûõ          
ïðîãðàììàõ.
Ïðèíöèï èñïîëüçîâàíèÿ
îïèñàòåëüíîãî
ÿçûêà
èçëîæåí
âûøå.
         
Îñòàíîâèìñÿ
íà
ðåôåðåíöèàëüíîì
ÿçûêå. Îí
îáðàùåí ê
çàäà÷å
çàìåíû
ïóíêòóàöèè          íà åå
îïèñàíèå,
íàïðèìåð
"òî÷êà" âìåñòî
"." èëè "òèðå"
âìåñòî "-".
Ýòî ìîæåò         
óïðîñòèòü
ïðîöåäóðó
êîìïüþòåðíóþ
èíòåðïðåòàöèè
òåêñòîâ,
îòëè÷àþùèõñÿ         
ðàçíîîáðàçèåì
ïóíêòóàöèè.
Ðåôåðåíöèàëüíûé
ÿçûê òàêæå
èñïîëüçóåò
áèáëèîòåêè           çàìåí,
õðàíèìûõ â
îòäåëüíîì
ôàéëå èëè äðóãîé
êîìïüþòåðíîé
ñèñòåìå.
Ñòðîãî           ãîâîðÿ, â
ýòîì îí
ñáëèæàåòñÿ
ñ îïèñàòåëüíûì
ÿçûêîì.
Íàêîíåö,
ìåòàÿçûê           ïðåäîñòàâëÿåò
ïîëüçîâàòåëþ
âîçìîæíîñòü
êîíòðîëèðîâàòü
è
èíòåðïðåòèðîâàòü
âñå          
ÿçûêè îáðàáîòêè
òåêñòîâ. 
          Äëÿ
èñòîðèêîâ,
èìåþùèõ
öåëüþ àíàëèç
òåêñòà,
áîëåå âñåãî
ïîäõîäèò
îïèñàòåëüíûé           ÿçûê.
Äîêóìåíòû,
ðàçìå÷åííûå
îïèñàòåëüíûì
ÿçûêîì,
òàêæå êàê è
çàêîäèðîâàííûå
ñ          
ïîìîùüþ
ïðîöåäóðíîãî,
èìåþò
çàãîëîâîê,
ñîäåðæàùèé
äîïóùåííûå
çíàêè          
îïèñàíèÿ. Îäíàêî
çíàêè
ðàçíûõ
îïèñàòåëüíûõ
ÿçûêîâ
ìîãóò
îòëè÷àòüñÿ
îò          
ïðîöåäóðíîãî
è ìåæäó
ñîáîé. Äëÿ
òîãî, ÷òîáû
áûëî âîçìîæíî
ïåðåôîðìóëèðîâàòü          
òåêñòû, ðàçìå÷åííûå
ðàçíûìè
ÿçûêàìè,
ñóùåñòâóåò
ìåòàÿçûê Standard
Generalized           Markup Language
(SGML) -
ñòàíäàðòíûé
îáîáùåííûé ÿçûê
ðàçìåòêè. Â
ñåðåäèíå           1980-ûõ SGML
êàê èíñòðóìåíò
òåêñòîëîãèè
ïîëó÷èë
îôèöèàëüíîå
ïðèçíàíèå          
Ìåæäóíàðîäíîé
Îðãàíèçàöèåé
Ñòàíäàðòîâ.
 1987 äëÿ
ïðîñòîòû
èñïîëüçîâàíèÿ          
ýëåêòðîííûõ
òåêñòîâ â
èññëåäîâàíèÿõ
âîçíèê
ìåæäóíàðîäíûé
íàó÷íûé
ïðîåêò Text           Encoding Initiative (TEI). Äëÿ
ñòàíäàðòèçàöèÿ
îáðàáîòêè
ýëåêòðîííûõ
èñòî÷íèêîâ
TEI èñïîëüçóåò
SGML.
          Ñðåäè
ðàçðàáîò÷èêîâ
áîëüøèíñòâà
ïðîãðàìì
îáðàáîòêè
òåêñòîâ
ïðåîáëàäàëè         
ìàòåìàòèêè
è ëèíãâèñòû,
èç-çà êîòîðûõ
ïðîãðàììíîå
îáåñïå÷åíèå
ñòàëî îòâå÷àòü         
ïðåæäå
âñåãî
çàäà÷àì ëèíãâèñòè÷åñêîãî
è
ëèòåðàòóðíîãî
àíàëèçà.
Ïðîáëåìà          èñòîðè÷íîñòè
òåêñòîâ
ðàçðàáîò÷èêàìè
íå ñòàâèëàñü
è íå
ðåøàëàñü.
Ïîýòîìó           êîíêðåòíî
èñòîðè÷åñêîå
èçó÷åíèå
òåêñòîâûõ
èñòî÷íèêîâ
ñ ïîìîùüþ
êîìïüþòåðíîãî          
êîíòåíò-
àíàëèçà
îáû÷íî
ñîïðîâîæäàåòñÿ
êëàññè÷åñêîé
íàó÷íîé
êðèòèêîé:         
îïðåäåëåíèåì
âðåìåííûõ è
ïðîñòðàíñòâåííûõ
ôàêòîðîâ, ïðÿìî
è êîñâåííî          
ïðèñóòñòâóþùèõ
â
äîêóìåíòàõ,
èõ
ñîöèàëüíîé
íàïðàâëåííîñòè,
îáùåñòâåííîãî          
êîíòåêñòà
âîçíèêíîâåíèÿ
èñòî÷íèêà,
èçìåíåíèåì
ñìûñëîâîãî
ñîäåðæàíèÿ
ïîíÿòèÿ âî         
âðåìåíè,
"ýçîïîâà ÿçûêà",
- òî åñòü
ó÷åòîì
ñîâîêóïíîñòè
ôàêòîðîâ, 
ëåæàùèõ
çà          
ïðåäåëàìè âû÷èñëèòåëüíîé
ëèíãâèñòèêè.
 ýòîì ñëó÷àå
áîëüøóþ ðîëü
íà÷èíàþò         
èãðàòü
èññëåäîâàíèÿ
ïî òåîðèè è
ïðàêòèêå
àðãóìåíòàöèè,
ðèòîðèêå,
ñîöèàëüíîé          ñåìèîòèêå,
ïñèõîëèíãâèñòèêå,
ëèíãâèñòè÷åñêîé
ñåìàíòèêå, ïðàãìàëèíãâèñòèêè
è òåîðèè           ìàññîâîé
êîììóíèêàöèè.
Ðàçìåòêà
òåêñòà ÿçûêàìè
ñåìàíòè÷åñêèõ
ìàðêåðîâ íå         
ìîæåò
ïîëíîñòüþ
ðåøèòü
çàäà÷è
àíàëèçà
ñîöèàëüíîé
èíôîðìàöèè.
Ïîíÿòèå
"àíàëèç òåêñòà"
â
áîëüøèíñòâå
ñëó÷àåâ
èñïîëüçîâàëîñü
         исследователями äëÿ
îáîçíà÷åíèÿ
âñåãî, ÷òî íå
ÿâëÿåòñÿ ïðîñòî
ïîèñêîì          â
äîêóìåíòå è
ïðîâåðêîé
ïðàâîïèñàíèÿ.
Ñðåäè
ôîðìàëüíûõ
ìåòîäîâ
îáðàáîòêè          социальных  òåêñòîâ
íà ïåðâîì
ìåñòå
îáû÷íî óïîìèíàåòñÿ
êîíòåíò-àíàëèç.
          Îáû÷íî
òåðìèí
"êîíòåíò-àíàëèç"
èñïîëüçóåòñÿ
äëÿ
îáîçíà÷åíèÿ
äâóõ ðàçíûõ
âåùåé:         
ìåòîäà äëÿ
àâòîìàòè÷åñêîé
êëàññèôèêàöèè
äîêóìåíòîâ
ïî
ñîäåðæàíèþ
è ìåòîäà äëÿ         
ðàñêðûòèÿ
çíà÷åíèÿ
ñëîâ è èäåé.
Àâòîìàòè÷åñêàÿ
êëàññèôèêàöèÿ
äîêóìåíòîâ
â          òå÷åíèå
ðÿäà ëåò
èñïîëüçóåòñÿ
â èñòîðèêî-ñîöèàëüíûõ
íàóêàõ è
áèáëèîãðàôè÷åñêèõ         
ñèñòåìàõ
ïîèñêà.
Òåêñò, åãî
ðåçþìå èëè
çàãîëîâîê
ñëóæàò
îñíîâíûìè
îñíîâàìè         
êëàññèôèêàöèè.
Íàïðîòèâ, ñåìàíòè÷åñêèé
êîíòåíò-
àíàëèç
íàöåëåí íà
îïðåäåëåíèå          îðãàíèçàöèè
ñëîâ âîêðóã
èäåé èëè ïîíÿòèé
â áîëüøåé
ñòåïåíè, ÷åì
íà îðãàíèçàöèè         
òåêñòà.
Ñóòü ïîäõîäà
çàêëþ÷àåòñÿ
â ñâåäåíèè
èçó÷àåìîãî
òåêñòà ê îãðàíè÷åííîìó         
íàáîðó
îïðåäåëåííûõ
ýëåìåíòîâ,
êîòîðûå
çàòåì
ïîäâåðãàþòñÿ
ñ÷åòó è
àíàëèçó íà          áàçå
ôèêñàöèè
÷àñòîòû
ïîâòîðÿåìîñòè
ñèìâîëîâ è
èõ
êîððåëÿöèè
äðóã ñ äðóãîì.
         
Ñëîâà â
òåêñòå ïðè
ýòîì
êëàññèôèöèðóþòñÿ
â
ñîîòâåòñòâèè
ñ èõ
äèñòàíöèîííûìè         
ñâÿçÿìè
ìåæäó ñîáîé.
Äëÿ ýòîãî
èñïîëüçóåòñÿ
ëèíãâèñòè÷åñêàÿ
è ñòàòèñòè÷åñêàÿ          òåõíèêà,
íàïðèìåð
êëàñòåðíûé
àíàëèç èëè
àíàëèç
ñâÿçåé. Â
ðàñïîðÿæåíèè         
òåêñòîëîãîâ
íàõîäèòñÿ
ðÿä ïðîãðàìì
àâòîìàòèçèðîâàííîãî
àíàëèçà äëÿ         
êîìïüþòåðîâ
IBM
         
Êîíòåíò-àíàëèç
â
ëèòåðàòóðíûõ
è ëèíãâèñòè÷åñêèõ
ðàñ÷åòàõ
íà÷àë èíòåíñèâíî         
ðàçâèâàòüñÿ
â 1950-õ ãîäàõ. Îí
îêàçàëñÿ
ïðèåìëåìûì
äëÿ
èçó÷åíèÿ
øèðîêîãî
êðóãà         
ïðîáëåì
ãóìàíèòàðíîãî
çíàíèÿ è
ñîöèàëüíûõ
íàóê. 
Êîíòåíò-àíàëèç
íàøåë         
ýôôåêòèâíîå
ïðèìåíåíèå
â
èññëåäîâàíèÿõ
ýòíî-
êóëüòóðíûõ,
ïîëèòè÷åñêèõ
ÿâëåíèé,          èñòîðèè
ìûñëè. 
Ñîöèîëîãè,
ñïåöèàëèçèðîâàâøèåñÿ
íà èññëåäîâàíèÿõ
ìàññîâîé         
êîììóíèêàöèè,
ïðèñòóïèëè ê
ðàçðàáîòêå
êîíòåíò-
àíàëèçà â
îñíîâíîì â
ÑØÀ.          
äàëüíåéøåì
ïðè ó÷àñòèè
ìàòåìàòèêîâ
åãî
ïðèìåíèëè â ïîëèòîëîãèè,
ôèëîñîôèè,         
ëèíãâèñòèêå.
Ïðèìåíåíèå
êîíòåíò-àíàëèçà
â èñòîðèè
îêàçàëîñü
îãðàíè÷åíî         
ïîòðåáíîñòüþ
â ñèëüíîé
êëàññè÷åñêîé
òðàäèöèè â
çíà÷èòåëüíî
áîëüøåé ñòåïåíè,
÷åì          â
ýìïèðè÷åñêîé
ñîöèîëîãèè
èëè
ïñèõîëîãèè,
ïîñòðîåííûõ
íà ìåòîäè÷åñêîì          ôóíäàìåíòå
íåïîñðåäñòâåííûõ
íàáëþäåíèé
è
ýêñïåðèìåíòîâ.
Êðîìå òîãî,         
êîíòåíò-àíàëèç,
íåñìîòðÿ íà
âèäèìóþ
èíòåðäèñöèïëèíàðíîñòü,
áûë ðàçðàáîòàí         
ïðåæäå
âñåãî â
ñâÿçè ñ
ïîòðåáíîñòÿìè
ñîöèîëîãè÷åñêèõ
èññëåäîâàíèé
ñîäåðæàíèÿ         
ìàññîâîé
êîììóíèêàöèè.
Ñîöèîëîãè
ñôîðìóëèðîâàëè
îáùèå
òåîðåòè÷åñêèå
ïðèíöèïû          ôîðìàëèçàöèè
ýìïèðè÷åñêèõ
äàííûõ, ïðèåìîâ
àíàëèçà
òåêñòîâ,
êîòîðûå ñ
òåõ ïîð          ñòàëè
ñîâîêóïíî
íàçûâàòüñÿ
êîíòåíò-àíàëèçîì.
Íåêîòîðûå
ïðîáëåìû
ïðèìåíåíèÿ         
äàííîãî
òèïà
àíàëèçà â
èñòîðèè
îêàçàëèñü
âíåøíèìè
ïðîÿâëåíèÿìè
ðÿäà         
òåîðåòèêî-ìåòîäîëîãè÷åñêèõ
ðàñõîæäåíèé
ìåæäó èñòîðè÷åñêîé
íàóêîé è
ñîöèîëîãèåé,          êàê
áëèçêèõ, íî
ñàìîñòîÿòåëüíûõ
ñîöèàëüíûõ
íàóê.
Ñîöèîëîãèçèðîâàííîñòü         
êîíòåíò-àíàëèçà
-
ñïåöèôè÷åñêàÿ
÷åðòà -
îñëîæíèëàñü
ïðÿìîé
çàâèñèìîñòüþ         
ðåçóëüòàòîâ
èññëåäîâàíèÿ
îò òîãî, ÷òî
èìåííî â
òåêñòå èññëåäîâàòåëü
ñ÷èòàåò         
âîçìîæíûì ïîäâåðãíóòü
ôîðìàëèçàöèè,
ïîäñ÷åòó, à
òàêæå
êàêèìè
òåîðåòèêî-         
ìåòîäîëîãè÷åñêèì
ïðèíöèïàìè
ïðè ýòîì îí
íàìåðåí
âîñïîëüçîâàëñÿ.
 êëàññè÷åñêîé         
ñòàòèñòèêå
äàííàÿ ïðîáëåìà
ðåøàåòñÿ íà
ïåðâîì ýòàïå
ñîñòàâëåíèÿ
ôîðìóëÿðà
äëÿ         
ñáîðà
ýìïèðè÷åñêèõ
äàííûõ. Â
òåêñòîëîãèè
åå ðåøàþò â õîäå
àíàëèçà
ýìïèðè÷åñêîãî          ìàòåðèàëà.  Ïðîáëåìà
ôîðìàëèçàöèè
â
òåêñòîëîãèè
áîëåå ñëîæíà.
Âîïðîñ î         
êîððåêòíîñòè
èçó÷åíèÿ
ôîðìàëèçîâàííûõ
òåêñòîâ â
çíà÷èòåëüíî
áîëüøåé
ñòåïåíè          îòêðûò
äëÿ êðèòèêè
ïî
ñðàâíåíèþ ñ
ìåòîäèêîé â
èçó÷åíèè
õîðîøî
ñòðóêòóðèðîâàííûõ          èñòî÷íèêîâ
òèïà ïåðåïèñåé
èëè
ôàáðè÷íî-çàâîäñêîé
ñòàòèñòèêè.
Îäíàêî
ïðîáëåìà         
òåîðåòè÷åñêîãî
àíàëèçà,
ïðîâåäåííîãî
äî è ïîñëå
âû÷èñëåíèé,
îñòàåòñÿ
îáùåé.
         
Ìîäåëèðîâàíèå
â
ïîëèòè÷åñêîé
è ñîöèàëüíî-
ýêîíîìè÷åñêîé
èñòîðèè
ïîñòîÿííî         
èñïûòûâàåò
åå âëèÿíèå
êàê
ðåçóëüòàò
ôóíäàìåíòàëüíûõ
îáúåêòíî-ñóáúåêòíûõ         
îòíîøåíèé
â îáëàñòè
ýïèñòåìîëîãèè.
          Â
êîëè÷åñòâåííîì
àíàëèçå
ïîâåñòâîâàòåëüíûõ
èñòî÷íèêîâ
èíòåðåñíûé
âîïðîñ
òàêæå         
ïðåäñòàâëÿåò
òåîðåòè÷åñêàÿ
âîçìîæíîñòü
âûáîðî÷íîãî
íàó÷íîãî èçó÷åíèÿ         
ìàòåðèàëîâ.
 ðÿäå
ñëó÷àåâ íå
ïðåäñòàâëÿåòñÿ
âîçìîæíûì
âûðàáîòàòü         
óíèâåðñàëüíûé
êðèòåðèé è
ìåòîä îòáîðà
âíóòðè
åäèíîãî
êîðïóñà
äîêóìåíòîâ,
òî åñòü          âûáîðêè
èç
ãåíåðàëüíîé ñîâîêóïíîñòè,
â îòëè÷èå îò
ðÿäà
ñòàòèñòè÷åñêèõ
äàííûõ,         
õàðàêòåðèçóþùèõñÿ
ìàññîâîñòüþ
è
ïîâòîðÿåìîñòüþ.
Èñïîëüçîâàíèå
âñåîáùåãî         
ïðèíöèïà
ïðåäñòàâèòåëüíûõ
âûáîðîê íå
âûäåðæèâàåò
êðèòèêè â
òåêñòîëîãèè
èç-çà         
îòñóòñòâèÿ
îäíîðîäíîñòè
ñîäåðæàíèÿ
äîêóìåíòîâ
åäèíîãî êîðïóñà.
Òåîðåòè÷åñêè          òðóäíî
èñêëþ÷èòü
ïðè ïðàâîâîì
àíàëèçå
äîêóìåíòîâ
àãðàðíîé
ïîëèòèêè,
íàïðèìåð,         
êàêîé-ëèáî
ïðîåêò èç
åäèíîãî
ïîðòôåëÿ
çàêîíîäàòåëüíûõ
ðåôîðì Äóìû. 
         
Ìåòîäû
êîíòåíò-àíàëèçà
ïðèâëåêàëèñü
ïðè
èññëåäîâàíèÿõ
ðàçëè÷íûõ
ïî âðåìåíè è          õàðàêòåðó
ïîâåñòâîâàòåëüíûõ
èñòî÷íèêîâ.
Áëèæå âñåãî
ê
ñîöèîëîãè÷åñêîìó         
ôóíäàìåíòó
ýòîãî
ìåòîäà îêàçàëèñü
èññëåäîâàíèÿ
èñòîðè÷åñêîé
ïðåññû.
Èìåííî äëÿ         
ïåðèîäèêè
êîíòåíò-àíàëèç
áûë
ðàçðàáîòàí,
è áëàãîäàðÿ
èíòåðåñó ê
ïðîöåññàì          ìàññîâîé
êîììóíèêàöèè
èñòîðèêè
ïîëó÷èëè
âîçìîæíîñòü
ôîðìàëüíîãî
àíàëèçà         
òåêñòîâ.
         
Áëàãîäàðÿ
ïîñòîÿííîìó
ïîèñêó ìåòîäîâ
òåêñòîëîãèè,
ïîÿâèëèñü
èññëåäîâàíèÿ         
ïîëèòè÷åñêîãî
ìûøëåíèÿ ñ
ïîìîùüþ
êîãíèòèâíîãî
êàðòèðîâàíèÿ,
ïðåîáðàçóþùåãî         
ëèíåéíóþ
àðãóìåíòàöèþ
â èåðàðõè÷åñêîå
äðåâî.
Íåñìîòðÿ íà
ðÿä íåðåøåííûõ         
ïðîáëåì
ôîðìàëèçàöèè
ðàññóæäåíèé,
äàííûå
èññëåäîâàíèÿ
ñîõðàíèëè         
ìåòîäîëîãè÷åñêóþ
çíà÷èìîñòü.
Îòõîä îò
ïðèíöèïà
ëèíåéíîñòè
ñòàë óäîáíûì         
ñïîñîáîì ïåðåñòðîéêè
èíôîðìàöèè
â
äàëüíåéøèõ
ëèíãâèñòè÷åñêèõ,
èñòîðè÷åñêèõ,          ôèëîñîôñêèõ
èññëåäîâàíèÿõ,
ðàçðàáîòêàõ
ïðîãðàììíîãî
îáåñïå÷åíèÿ
äëÿ àíàëèçà         
ïèñüìåííûõ
èñòî÷íèêîâ.
Âîîáùå, ìåòîäîëîãè÷åñêèå
ïðîáëåìû
ïðèìåíåíèÿ         
êîãíèòèâíûõ
ìåòîäîâ â
èññëåäîâàíèÿõ
çàíÿëè
îñîáîå
ìåñòî ñðåäè
ñïåöèàëèñòîâ
â         
îáëàñòè
ìîäåëèðîâàíèÿ
ñîöèàëüíîãî
âçàèìîäåéñòâèÿ,
ñîöèàëüíîé
ïñèõîëîãèè
è         
ïîëèòè÷åñêîãî
ìûøëåíèÿ
èç-çà òîãî,
÷òî ôîðìàëüíûé
àíàëèç â
ïåðå÷èñëåííûõ         
ñîöèàëüíûõ
íàóêàõ
ðàçâèâàëñÿ
ïîä
îïðåäåëÿþùèì
âëèÿíèåì
àìåðèêàíñêîãî         
ìàòåìàòèêà
Àêñåëüðîäà è
ãðóïïû
èññëåäîâàòåëåé
âî ãëàâå ñ
Áîíåìîì è
Øàïèðî,         
óâëåêàâøèìñÿ
ôðàíöóçñêèì
ñòðóêòóðàëèçìîì
ïîä âëèÿíèåì
Ôóêî. 
         
Îáðàùåíèå
ê
ìåíòàëüíûì
êàòåãîðèÿì
îñíîâàíî íà
ñòðåìëåíèè
îáúÿñíèòü
ïðîöåññ          ïðèíÿòèÿ
ðåøåíèÿ ñ
ïîìîùüþ
ìåòîäîâ
ïîíèìàíèÿ
òåêñòà, тåîðåòè÷åñêè-èãðîâîãî         
ìîäåëèðîâàíèÿ.
Ïîäðîáíî
ïðîáëåìû
êîãíèòèâíîãî
êàðòèðîâàíèÿ
è
îïåðàöèîííîãî          êîäèðîâàíèÿ
êàê
âçàèìîäîïîëíÿþùèõ
ìåòîäîâ àíàëèçà
ïðîöåññà
ïðèíÿòèÿ
ðåøåíèÿ         
ðàññìàòðåíû
â ñòàòüå
èçâåñòíûõ
íîðâåæñêèõ
ïîëèòîëîãîâ
Õåðàäñòâåéòà
è         
Íàðâåñåíà.
Îíè ðàçîáðàëè
ðÿä
ìåòîäîëîãè÷åñêèõ
âîïðîñîâ èñïîëüçîâàíèÿ         
êîäèðîâàíèÿ
è êàðòèðîâàíèÿ
êàê ìåòîäîâ
êîãíèòèâíîé
ðåïðåçåíòàöèè
ïîëèòè÷åñêîãî         
ìûøëåíèÿ ïðè
ïîìîùè
êîìïüþòåðà.
Êî âðåìåíè
íàïèñàíèÿ
ñòàòüè
èññëåäîâàíèÿ          ïî
êîìïüþòåðíîìó
ìîäåëèðîâàíèþ
ïîëèòè÷åñêîãî
ìûøëåíèÿ
íîñèëè         
ýêñïåðèìåíòàëüíûé
õàðàêòåð. Íà÷àëî
èì ïîëîæèëè
ðàáîòû
ïðîôåññîðà
Éåëüñêîãî          
óíèâåðñèòåòà
Àáåëüñîíà.
Àáåëüñîí
ñòàë
èçâåñòåí
ðÿäîì
ìåæäèñöèïëèíàðíûõ
ðàáîò          
ïî
ïðèìåíåíèþ
ìåòîäîâ
êîìïüþòåðíîãî
ìîäåëèðîâàíèÿ
ê èçó÷åíèþ
ïîëèòè÷åñêîãî         
ìûøëåíèÿ è
ðàçâèòèþ
êîãèòîëîãèè.
Èì áûëà
ñîçäàíà
îäíà èç
ïåðâûõ
èåðàðõè÷åñêèõ         
ìîäåëåé
ïîíÿòèéíûõ
ñòðóêòóð.
Ðàáîòà
Àáåëüñîíà â
îáëàñòè
"êîãíèòèâíîãî         
äèññîíàíñà"
ïîëîæèëà
íà÷àëî
ñîòðóäíè÷åñòâó
ñ Øåíêîì,
ðåçóëüòàòîì
êîòîðîãî
ñòàëà         
ñîâìåñòíàÿ
êíèãà è ðÿä
ñèñòåì èíòåðïðåòàöèè
ïîëèòè÷åñêèõ
òåêñòîâ .
 
         
Ðåçþìèðóÿ,
îòìåòчу, ÷òî
êîìïüþòåðíûé
àíàëèç
òåêñòîâ
âîáðàë â
ñåáÿ          
äîñòèæåíèÿ
íåñêîëüêèõ
íàó÷íûõ
ïîäõîäîâ.
Âûÿñíèëîñü,
íàïðèìåð,
÷òî ïðè
îáðàáîòêå          è
àíàëèçå
òåêñòà äëÿ
èññëåäîâàòåëåé
âàæíîå
çíà÷åíèå
èìååò ïîêàç
÷àñòîòû         
âñòðå÷àåìîñòè
ðàçëè÷íûõ
êëàññîâ
ëåêñèêè (concordances).
Ýòî
ïîçâîëÿåò
òî÷íî          
îïðåäåëÿòü
çíà÷åíèå
êîíêðåòíûõ ñëîâ
è ôðàç â
êîíòåêñòå.
Ñîâìåñòíàÿ         
âñòðå÷àåìîñòü
÷àñòåé ðå÷è
âïåðâûå áûëà
èñïîëüçîâàíà
íà ïðàêòèêå
ïðè èçó÷åíèè         
òî÷íîãî
çíà÷åíèÿ
ñëîâ Áîãà è
ïðîðîêîâ â
áèáëåéñêèõ
òåêñòàõ.
Ïåðâîå          êîìïüþòåðèçèðîâàííîå
èññëåäîâàíèå
â äàííîé
ãóìàíèòàðíîé
îáëàñòè
áûëî          
ïðîâåäåíî
ñâÿùåííèêîì
Áóçîé äëÿ
ñîñòàâëåíèÿ
÷àñòîòíîãî
ñëîâàðÿ
ðàáîò Ôîìû         
Àêâèíñêîãî.
Â
äàëüíåéøåì
êàòîëè÷åñêèå
òåîëîãè,
âñòàâøèå ó
èñòîêîâ
èñòîðè÷åñêîé          êîëè÷åñòâåííîé
ôèëîëîãèè,
ñîçäàëè
ñàìîñòîÿòåëüíóþ
øêîëó
êîìïüþòåðèçèðîâàííîãî          
àíàëèçà
ñàêðàëüíîé
ëèòåðàòóðû ñ
öåíòðîì âî
ôðàíöóçñêîì
êàòîëè÷åñêîì         
óíèâåðñèòåòå
ã. Ëóâåí. Â 1968
ïðè íåì áûë
îáðàçîâàí
Öåíòð
ýëåêòðîííîé
îáðàáîòêè         
äîêóìåíòîâ
CETEDOC. Стоит отметить, ÷òî
ñîâìåñòíàÿ
âñòðå÷àåìîñòü,          èññëåäîâàííàÿ
âïåðâûå
òåîëîãàìè,
íå ÿâëÿåòñÿ
ñòàòèñòè÷åñêîé
ìåðîé. Ýòî          ðåîðãàíèçàöèÿ
òåêñòîëîãè÷åñêîé
èíôîðìàöèè
äëÿ
âûäåëåíèÿ
êîíòåêñòà          èñïîëüçîâàíèÿ
îïðåäåëåííûõ
ñëîâ.
Êîìïüþòåðíûé
ïîêàç
ñîâìåñòíîé          
âñòðå÷àåìîñòè
ñëîâ
ÿâëÿåòñÿ,
ïî-ñóùåñòâó,
ñàìûì ñòàðûì
è íàèáîëåå         
ðàñïðîñòðàíåííûì
ñïîñîáîì
ïðèìåíåíèÿ
êîìïüþòåðà â
ãóìàíèòàðíîé
îáëàñòè.
         
Íà÷èíàÿ ñ
1950-õ ãîäîâ
áîëüøèíñòâî
ñîâðåìåííûõ
è ñòàðûõ
åâðîïåéñêèõ
ÿçûêîâ          áûëè
ïîäâåðãíóòû
ïîäîáíîé îáðàáîòêå,
÷òî ïðèâåëî ê
âêëþ÷åíèþ
àíàëèçà         
âñòðå÷àåìîñòåé
â ñîñòàâ
ðàñõîæèõ
ìåòîäîâ
òåêñòîëîãèè
è
èñ÷åçíîâåíèþ         
ïðåäñòàâëåíèÿ
î íåì êàê î
íîâîì è ýêñïåðèìåíòàëüíîì. 
         
Îäíèì èç
ñïîñîáîâ
äåìîíñòðàöèè
ñîâìåñòíîé
âñòðå÷àåìîñòè
ìîæåò
ÿâëÿòüñÿ           ïåðå÷åíü
ñëîâ ñ óêàçàíèåì
íà
ìåñòîíàõîæäåíèÿ,
ïðè÷åì
êëþ÷åâûå
ñëîâà         
ïîêàçûâàþòñÿ
ñïðàâà èëè ñëåâà
îò
êîíòåêñòà. Â
äàííîì
ñëó÷àå ïåðå÷åíü
íå ìîæåò         
ðàñöåíèâàòüñÿ
êàê äîñòàòî÷íàÿ
äëÿ èñòîðèêà
ïåðåñòðîéêà
òåêñòà, ïðè
êîòîðîé         
æåëàòåëüíî
äåìîíñòðèðîâàòü
ñåìàíòè÷åñêîå
îêðóæåíèå
äëÿ êàæäîé
âñòðå÷àåìîñòè.
          Áåç
ýòîãî
èññëåäîâàòåëü,
èñïîëüçóþùèé
ïîäãîòîâëåííûå
ðåçóëüòàòû,
íå ìîæåò         
èçáåæàòü
íåîáõîäèìîñòè
ïîñòîÿííîãî
îáðàùåíèÿ ê
îðèãèíàëó
äëÿ ïðîâåðêè          
èñïîëüçîâàíèÿ
ñëîâà. Ñ
ïîäîáíîé
ôîðìîé èçëîæåíèÿ
ðåçóëüòàòîâ
íà ãðàíèöå          
êîíòåêñòà
ñâÿçàí
ôîðìàò
äåìîíñòðàöèè
ñîâìåñòíîé
âñòðå÷àåìîñòè
KWOC -           "êëþ÷åâîå
ñëîâî áåç
êîíòåêñòà"
(keyword-out-of-context), êîòîðûé
ðàçðàáàòûâàëñÿ          äëÿ
èññëåäîâàíèÿ
ïðîçàè÷åñêèõ
òåêñòîâ. 
         
Âìåñòå ñ
àíàëèçîì
ïðîçû òåñíî
ðàçâèâàëîñü
èçó÷åíèå
ïîýòè÷åñêîãî
ÿçûêà ñ          
àêöåíòîì
íà
äåìîíñòðèðîâàíèå
êîíòåêñòà
ñëîâ â
ïîýòè÷åñêîé
ñòðîêå êàê
îñíîâíîé          åäèíèöå
ïðîèçâåäåíèÿ.
Áîëüøèíñòâî
èññëåäîâàíèé
â ñîçäàíèè
êîìïüþòåðíûõ         
ïðîãðàìì
äëÿ ïîêàçà
ñîâìåñòíîé
âñòðå÷àåìîñòè
êëàññîâ
ëåêñèêè
ïîñëåäîâàëè          
äàííîìó
ïðèíöèïó. Â
ðåçóëüòàòå
ñïåöèàëèñòû
ïðèøëè ê
àëüòåðíàòèâíîìó
KWOC'ó         
ôîðìàòó -
"êëþ÷åâîå
ñëîâî â
êîíòåêñòå" KWIC
(keyword-in-context). Âìåñòî         
äåìîíñòðèðîâàíèÿ
ïîëíîãî êîíòåêñòà
ïðåäëîæåíèÿ,
÷àñòî
çàíèìàâøåãî
íåñêîëüêî          
ñòðîê, êàê
ýòî áûëî âîçìîæíî
ïðè ïðèíÿòèè
ôîðìàòà
KWOC-ôîðìàòà, KWIC          
äåìîíñòðèðîâàë
êëþ÷åâûå
ñëîâà â
öåíòðå
ýêðàíà
êîìïüþòåðà ñ
êîíòåêñòîì,         
óìåùàþùèìñÿ
íà îäíîé
ñòðîêå. Ïðè
âêëþ÷åíèè
äàííûõ â
èññëåäîâàíèÿ,
îðãàíèçîâàííûå
íà         
îñíîâå KWIC'à
èëè KWOC'à,
ñïåöèàëèñòàìè
÷àñòî
ïîä÷åðêèâàåòñÿ
îòðèöàòåëüíîå          
âîçäåéñòâèå
íà
ðåçóëüòàòû
ñëàáîé
êðèòèêè
èñòî÷íèêîâ,
ïðåäâàðÿâøåé
ðàñ÷åòû.
Ýòî         
âûðàæàåòñÿ
â íåÿñíîñòè
ìåòîäèêè
èññëåäîâàíèÿ,
îãðàíè÷åííîñòè
âûâîäîâ,
èçëèøíåé          
äåòàëèçàöèè.
          Â
÷èñëå
íàèáîëåå
ýôôåêòèâíûõ
ïðîãðàìì äëÿ
èññëåäîâàíèÿ
ñîâìåñòíîé           âñòðå÷àåìîñòè
â ôîðìàòå KWIC
äîâîëüíî
÷àñòî
óïîìèíàåòñÿ
COCOA (COunt and          COncordance
Generation on Atlas), ðàçðàáîòàííàÿ
êîìïüþòåðíîé
ëàáîðàòîðèåé         
"Àòëàñ" â
Àíãëèè (Chilton Atlas Computer
Laboratory). Ïðîãðàììà
íàïèñàíà
äëÿ          äåìîíñòðàöèè
ñîâìåñòíîé
âñòðå÷àåìîñòè
ñëîâ è èõ
ïîäñ÷åòà
áðèòàíñêèì
ó÷åíûì          
Ðàññåëîì (D.B.Russell)
â 1967. ÑÎÑÎÀ
ñîñòîÿëà èç
÷àñòîòíîãî
ïðîôèëÿ è
òðåõ           òàáëèö,
ñîäåðæàùèõ
ñïèñîê ñëîâ
ñ óêàçàíèåì
÷àñòîòû èõ
âñòðå÷àåìîñòè
â òåêñòå,          ñëîâàðÿ è
ïîðÿäêà
"ãðàôè÷åñêîé
ðèôìîâêè".
Îíà áûëà â
ñîñòîÿíèè
ïîêàçûâàòü
è          
ñîðòèðîâàòü
êëþ÷åâûå
ñëîâà â êîíòåêñòå.
Çàìåòèì,
÷òî
ñóùåñòâóåò
âîçìîæíîñòü         
ïîêàçà íå
òîëüêî ñëîâ,
íî è áóêâ â
êîíòåêñòå - KLIC
(key-letter-in-context). Îäíàêî         
ïîñëåäíèå 30
ëåò
àâòîìàòè÷åñêîå
èíäåêñèðîâàíèå
è
èññëåäîâàíèå
êîíôèãóðàöèé           ñëîâ
â ôîðìàòå KWIC
ïîêàçûâàëî,
ãëàâíûì
îáðàçîì,
÷àñòîòó
ñëîâ â òåêñòå
è ñïèñêè         
êëþ÷åâûõ
ñëîâ â
êîíòåêñòå.
Ïðîãðàììû
ðåîðãàíèçîâûâàëè
ëèíåéíûé
òåêñò          "âåðòèêàëüíî"
òàêèì
îáðàçîì, ÷òî
êàæäàÿ ôîðìà
êàæäîãî
ñëîâà ìîãëà
áûòü áûñòðî          
íàéäåíà ïî
ïðàâîïèñàíèþ
èëè
ñëîâàðíîé
ôîðìå. Âûãîäû
íåëèíåéíîãî         
ïðåäñòàâëåíèÿ
òåêñòà,
èñïîëüçîâàííûå
â
êîãèòîëîãèè,
ïîëèòîëîãèè
è èñòîðèè,
áûëè          ðàçâèòû
òåêñòîëîãàìè.
Ïðèíöèïû ÑÎÑÎÀ
â KWIK'å
îêàçàëèñü
èñïîëüçîâàíû
â ðÿäå          
ïðîãðàìì
äëÿ
IBM-ñîâìåñòèìûõ
êîìïüþòåðîâ.
Ñðåäè íèõ
÷àñòî
óïîìèíàþòñÿ
Oxford          Ñoncordance
Programm (OCP; Hockey, Martin, 1988:
ïåðåðàáîòàíà
â Micro-OCP),          WordCruncher (Jones, 1987), TACT (Bradley,
Presutti 1990), KAYE (Kaye, 1989), CLAN           (MacWhinney, Snow, 1990). Îíè
ïîçâîëèëè
ðåøàòü
íåêîòîðûå
âîïðîñû          ñòèëèñòè÷åñêîãî,
ëèíãâèñòè÷åñêîãî,
ëåêñè÷åñêîãî
àíàëèçà âî
ìíîãî ðàç
áûñòðåå ïî          ñðàâíåíèþ
ñ
ïðåäûäóùèìè
ïðîãðàììàìè.
 ïîñëåäíèå
äåñÿòü ëåò
íîâîå
ïîêîëåíèå         
ïðîãðàììíîãî
îáåñïå÷åíèÿ
èñïîëüçóåò
ýôôåêòèâíóþ
îáðàáîòêó
òåêñòà,          
îïèðàþùóþñÿ
íà
"òîïîãðàôè÷åñêèé"
ïðèíöèï
ðåîðãàíèçàöèè
ñëîâ â
òåêñòå. Îíè         
ïðåäñòàâëåíû
â ôîðìå
íåëèíåéíûõ
ãèñòîãðàìì
íà îñíîâå èõ
ïîçèöèè â
ëèíåéíîì          òåêñòå.
Ïðîãðàììû WordCruncher
è Tact ïîçâîëèëè
ïîêàçàòü
ðàñïðåäåëåíèå         
îïðåäåëåííûõ
ñëîâ â ôîðìå
ãðàôèêà, íà
êîòîðîì
âèäíî
íàëè÷èå èëè
îòñóòñòâèå
òàêèõ          ñëîâ â
÷àñòÿõ
òåêñòà. Ýòè
ñëîâà
èíîãäà
íàçûâàþò "ïëþñîâûìè"
èëè
"ìèíóñîâûìè",          êîãäà
îíè
âñòðå÷àþòñÿ
áîëåå èëè
ìåíåå ÷àñòî
â îäíîì
ìåñòå, à íå â
äðóãîì.
Методика 
проведения контент-анализа
            В этой  части работы я опишу 
методику проведения контент-анализа текстовой информации.  Эта технология была разработана  профессором 
Розовым Н.С. из Днепропетровского государственного университета.
Предпосылки и определения
Данная
методика, предназначенная для индивидуальной работы с целостным осмысленным
текстом (далее просто текстом) и последующего коллективного обсуждения
экономических текстов, основывается на следующих предпосылках и определениях.
Предпосылка 1. Нет и, по-видимому, не может быть чисто
механической процедуры, приводящей к адекватному целостному пониманию текстов.
В то же время упорядоченное сочетание формальных, полуформальных процедур и
творческих (направленных на "инсайт")задач служит хорошую службу для
их понимания.
Предпосылка 2. Несмотря на все возможное разнообразие,
содержание любого текста может быть раскрыто через выявление а)концептуальных
моделей, б) основополагающих онтологических, ценностных и гносеологических
предпосылок.
Предпосылка 3. Несмотря на все возможное разнообразие
концептуальных моделей в содержании текстов, суть каждой может быть более или
менее адекватно задана через представление следующих формальных элементов:
а) основные
объекты со свойствами (идеальные и/или материальные),
б) основные
субъекты со свойствами (как правило, человеческие индивиды, группы, общества,
родовые субъекты, либо сверхъестественные существа, такие как Бог),
в) воздействия
(то, что существенно меняет свойства или отношения предметов воздействия),
г) превращения
(переходы объектов или субъектов в иное состояние с иными свойствами и
отношениями),
д) основные
бинарные (объект-объектные, субъект-субъектные и субъект-объектные) и тернарные
отношения.
Предпосылка 4. Несмотря на все возможное разнообразие
ценностей и ценностных систем, основные элементы концептуальной модели каждого
социально-философского текста они могут быть более или менее адекватно
представлены через уточнение и заполнение пространства, заданного двумя
фундаментальными координатами: Добро-Зло (чисто моральные оценки) и
Сила-Слабость (высокий-низкий социальный статус или влиятельность (что включает
могущество, богатство, престиж).
Предпосылка 5. Несмотря на все возможное разнообразие
используемых онтологий основные элементы концептуальных моделей текстов могут
быть более или менее определенно отнесены к одной из следующих сфер бытия
("миров"):
материальный мир или
биотехносфера (все материальные предметы, включая человеческие тела, ландшафты,
жилища, технику и т.п.),
социосфера (отношения и
взаимодействия между людьми, в том числе по поводу материальных предметов и
идей);
психосфера (сознание, психика и
общение людей);
культуросфера (как пространство
идей и шире - образцов, используемых в человеческих обществах);
трансцендентная или запредельная
сфера (пространство существования сверхъестественных существ и сущностей (таких
как Бог, боги, Абсолют и т.п.), зачастую эта сфера не отделяется от
культуросферы, как у Платона, Гегеля и др.
Предпосылка 6. Замечание для сомневающихся. Ни одна из
представленных предпосылок не является абсолютной истиной, но дискуссия об их
правомерности станет осмысленной только после долговременной практики освоения
методики. К предпосылкам, определениям и к самой методике (данной ниже) следует
относиться как к средству, позволяющему выявить некий СМЫСЛОВОЙ СРЕЗ любого
философского текста. Никто не может поручиться, что этот срез полностью
исчерпывает возможное понимание и прочтение текста (вероятно, это в принципе
невозможно). Но это не означает, что не следует учиться хорошо пользоваться
хотя бы этим несовершенным инструментом.
Методика как последовательность шагов
1 шаг. Разбиение текста, подлежащего анализу, на фрагменты.
Простейшее и эффективное решение
1 страница = 1 фрагмент. Для небольших (менее 20 страниц) и идейно
"плотных" текстов фрагмент может быть уменьшен (например, до ½
или ¼ страницы или до 10, 5 строк). Для больших (более 30 страниц) и
идейно "разряженных" текстов фрагмент может быть увеличен до 5-20
страниц. Важно установить вначале размер фрагмента и не менять его до конца
работы с текстом.
2 шаг. Подготовка формы таблицы.
Обязательно в заголовок вынести точные выходные данные
издания, дату заданного срока выполнения работы, свои фамилию и имя, решение о
размере фрагмента. Разворот тетради линуется вертикальными полосами на
следующие столбцы:
Ø
на левой стороне 6 столбцов - N фрагмента, Страница(ы),
Объекты-
     Субъекты-Воздействия-Превращения,
Переменные-Связи, Логическая конструкция,     
Краткое содержание
Ø
на правой стороне 3 столбца - Онтология, Аксиология,
Обобщенное      экономическое  содержание (тезис фрагмента)
Таблица 1.  Форма таблицы для последовательной работы с
фрагментами текста № фрагмента № страницы Субъекты, объекты Переменные и причинность Логическая конструкция Краткое содержание Отношения и границы Аксиология Обобщенное экон. Содержание 1 2
3 шаг. Последовательное заполнение таблицы по фрагментам.
Каждому фрагменту соответствует "большая строка" (ограниченная сверху
горизонтальной линией). Фрагмент прочитывается целиком, затем принимаются
решения о заполнении каждого столбца по фрагменту. Рекомендуется заполнять
строку по каждому фрагменту "слева-направо" 
Шаг 3.1. Непременно ставить номера фрагментов (это их
"индивидуальные имена" при последующей обработке таблицы) и страниц
(для вероятного последующего обращения к тексту).
Шаг 3.2. Заполнение левой стороны таблицы
ВОЗДЕЙСТВИЯ И ПРЕВРАЩЕНИЯ
(Механизм взаимодействия)
Выделяются новые главные субъекты
и объекты фрагмента
Далее выделяются только те
воздействия, превращения, которые относятся к этим субъектам и объектам (см.
Предпосылку 3). Заносится графическое изображение с краткими обозначениями всех
символов (кроме превращений, для которых закреплен символ - двойная стрелка)  Проверка правомерности сделанных выборов
проверяется таким образом:  значимы те
объекты и субъекты, наличие и "поведение" которых существенно для
наиболее важных  воздействий и
превращений. Значимы те воздействия, которые ведут к существенным превращениям.
Значимы те превращения, в ходе которых меняются важнейшие свойства объектов или
субъектов. 
Несложно заметить "круговой
характер" данной проверки. Действительно, в понимании текстов нет
абсолютно "твердой почвы", однозначных рецептов и жесткой логики.
Иногда исходить следует от объектов и субъектов, иногда от воздействий и
превращений, иногда от отношений.
Последующий круговой характер
проверки дает возможность сформировать "наиболее крепко сколоченную"
структуру понятого. Данный круг - это не порочный логический круг, а
традиционный для герменевтики способ последовательных итераций: возвратов и
уточнений, новых возвратов и новых уточнений. 
Как правило, выделяются 1-3 основных объекта и субъекта, 0-2 воздействия,
0-1 превращения. Данные схемы являются "заготовками" для последующего
построения механизма взаимодействия (через обобщение, отбор и синтез).
Переменные и причинность
Для каждого фрагмента выделяются
1-2 главных переменных (шкалы, по которым происходят изменения, или значения
которых наиболее существенны в содержании фрагмента), каждая переменная
изображается как вершина графа (кружок) с названием (обычно начинается со слова
"Уровень...") . Если в тексте указывается или явно предполагается
связь между переменными, то ставится соответствующая стрелка со знаком + или -.
Это "заготовки" для последующего синтеза тренд-структуры по всему
тексту.
Логическая конструкция
Выделяются и изображаются с
помощью графических схем главные логические отношения между понятиями и
суждениями. Основные графические средства: круги Эйлера, отражающие отношения
между понятиями,  "древесные"
или иные классификации (наглядное изображение деления понятий), всевозможные
таблицы. Данная графа играет вспомогательную роль, она может использоваться, в
частности для выявления "тезиса фрагмента".
Шаг 3.3. Краткое содержание фрагмента представляется либо
выписанной краткой (1-2 строки книги) цитатой, либо столь же кратким
обозначением главного содержания своими словами. Играет мнемоническую роль
(вертикальная графа с краткими содержаниями – это фактически конспект текста,
по нему можно готовиться к экзамену, чтобы не читать текст вторично).
Шаг 3.4. Заполнение правой стороны таблицы
Онтология
Выделяются родовые (наиболее
обобщенные) сущности, и родовые отношения. В графе строится простейший рисунок
как "заготовка" для последующей модели общей онтологической структуры
текста.   Если в тексте явно указывается
на разные "миры", то проводятся соответствующие границы. Расположение
символов как на "пофрагментных заготовках", так и на итоговой
онтологической структуре.
Аксиология
Фиксируются ценности,  правила и оценки. 
Ценности ( предельные нормативные
идеи) подразумевают обычно   такие
предикаты как должно, хорошо, быть благом, быть обязательным, быть желательным,
быть запрещенным, быть лучшим, быть прекрасным и т.д. Ценности можно выражать
одним словом или  словосочетанием
(выгода, власть, стабильность, моральное добро, справедливость, и т.д.).
Правила - любого рода максимы,
императивы, рекомендации, советы и т.д., основанные на ценностях.
Оценки суть применения ценностей
к объектам, субъектам, воздействиям, трансформациям или отношениям (которые,
как правило, уже выделены ранее для данного фрагмента.
Оценки выражаются двумя
стандартными формулами:
А(объект, субъект и т.д.)
одобряется за Ц (соответствие ценности) 
или  А одобряется за не-Ц
(несоответствие ценности)
    Если оценок в тексте нет - то не нужно их и фиксировать. Если
оценки есть, но ценности явно не указаны, то ценности необходимо реконструировать,
но записать в скобках.
Выявление "тезиса фрагмента" (обобщенного экономического
содержания) Здесь не следует "придумывать" ничего нового. Просто
нужно постараться, что главное во фрагменте:
если главное - описание
воздействий и превращений, то передать в тезисе содержание столбца  3; 
если главное - выявление причинной зависимости, то передать в тезисе
содержание столбца 4;  если главное -
логика работы с понятиями и суждениями, то зафиксировать содержание
столбца  5;  если главное (что редко) - построение онтологии, то зафиксировать
содержание столбца 7,  если главное -
ценности, оценки и правило, то тезис будет аксиологический. 
   Если удастся, то можно 
формулировать и синтетический тезис, но это сложное задание.
4 шаг. (Квази)статистическая обработка столбцов. После
заполнения всей таблицы (по фрагментам - строкам) итоговый анализ ведется
преимущественно  по аспектам-столбцам.
Используется допущение, что систематически появляющиеся во фрагментах текста
элементы являются и наиболее значимыми (по принципу "у кого что болит, то
о том и говорит").
При этом следует предельно
внимательно отнестись к конечному выбору "лидеров", поскольку именно
они станут элементами последующих концептуальных моделей (а все остальные
элементы - лишь проясняющими моментами).
5 шаг. Построение модели (механизма) взаимодействия.
Стандартное оформление Разворот
тетради делится на 4 прямоугольника. Каждый из них именуется: Левый верхний -
Модель взаимодействия, Правый верхний - Онтологическая модель, Левый нижний - Тренд-структура,
Правый нижний - Аксиология. 
Необходимо строить графические
схемы на черновиках (лучше с карандашом и резинкой), а в тетрадь заносить
только конечные результаты.
Шаг 5.1. Переопределить оси Добра-Зла и Высокого-Низкого
статуса (см. предпосылку 4)  согласно
ценностным предпосылкам (см.шаг 3).
Шаг 5.2. Расположить "элементы-лидеры" (см.шаг 4):
объекты (прямоугольники) и субъекты (упрощенные символы человеческой фигуры)
согласно их явным или неявным оценкам в тексте.
Шаг 5.3. Обозначить главные ("лидирующие")
воздействия между элементами (одинарные 
стрелки), и главные превращения элементов (двойные стрелки). В обоих
случаях должны быть представлены преимущественно не однократные события, а
повторяющиеся, сущностные изменения, формирующие как бы постоянно действующий
"механизм". Нередко это уже "додумывание" за автора,
раскрытие потенциала его рассуждений для построения концептуальной модели
механизма функционирования или развития. 
Шаг 5.4. Каждый элемент графической схемы (вершины и стрелки)
снабдить кратким именем и указанием номеров фрагментов, служащих главными
источниками для такой модели. 
Шаг 6. Построение онтологической модели.
 Шаг 6.1. Разделить
пространство листа на поля, соответствующие "сферам бытия": весь
нижний слой - биотехносфера, центр среднего слоя - психосфера, левая часть
среднего слоя - социосфера, правая часть - культуросфера, верхний слой -
трансцентентная сфера
Шаг 6.2. Расположить родовые понятия для объектов и
субъектов ("лидеров") в соответствующих сферах или на их границах
(обозначения те же).
Шаг 6.3. Обозначить стрелками основные отношения между
родовыми понятиями.
Шаг 6.4. Каждый элемент графической схемы (вершины и
стрелки) снабдить кратким именем и указанием номеров фрагментов, служащих
главными источниками для такой модели. 
В итоге должна получиться картина взаимосвязи главных сущностей
(собственно, онтологическая модель), лежащей в основе содержания текста.
 
Предпосылка 7. Несмотря на все возможное разнообразие
концептуальных  моделей, во многих их
них целесообразно выделить динамический аспект, который можно более или менее
адекватно представить через положительные и/или отрицательные связи между
несколькими (обычно 2-5) переменными, как минимум двузначными ("есть
признак/нет признака"). Эту связь переменных или тренд-структуру удобнее
всего представлять в виде ориентированного графа с вершинами-переменными и
стрелками - отрицательными и положительными связями. К примеру, казалось бы
далекий от темы динамики, диалог о справедливости в начале второй главы
Платонового "Государства" реконструируется как выявление
положительных связей от справедливости человека (переменная С) к пользе П
(высокому социальному статусу, включающему также могущество и престиж), от П к
счастью СЧ, а также проблематизация Фрасимахом наличия иной связи между
справедливостью (С) и счастьем (СЧ).
Шаг 7. Построение тренд-структуры
Шаг 7.1. Определение переменных. Как правило, даже для
больших и сложных текстов вполне достаточно выделение 3-4 переменных, реже 5-7;
большее количество не рекомендуется, так как из-за плохо понятой сложности
ускользнет самая суть динамического взаимодействия.
Шаг 7.2. Обозначить стрелками положительные и отрицательные
связи между переменными (соответственно, обозначенные знаками "+" и
"-") на основе анализа отношений в онтологической модели и
воздействий в модели механизма.
Шаг 7.3. Проверить "работу" тренд-структуры
мысленным экспериментом, увеличивая и уменьшая значения разных переменных и
анализируя, что согласно связям происходит с другими переменными, насколько это
соответствует положениям текста. Следует быть готовыми к тому, что
тренд-структура "противоречит" положениям текста. При большем доверии
к тексту следует подправить тренд-структуру (обычно через переопределение переменных
и изменение характера связей между ними). Однако нередко случается, что
тренд-структура дает более глубокое и основательное понимание существа дела,
что дает основание судить об "ошибках" авторов текстов, в том числе и
классических текстов.
Шаг 7.4. Снабдить все элементы тренд-структуры
(вершины-переменные, вершины-постоянные и стрелки) краткими именами с указанием
номеров фрагментов, служащих главными источниками для построения такой
тренд-структуры.
Пояснение к тренд-структурам
Главное предназначение тренд-структур
- служить комплексной объяснительной гипотезой динамики изменения предметной
области. При этом каждая связь между переменными претендует на статус
"закона". 
Тренд-структуры - это достаточно поздно изобретенное познавательное
средство, поэтому не следует удивляться, что практически всегда будет иметь
место "домысливание" за автора текста, поскольку ни о каких
переменных он, как правило, и не помышлял. Таким образом, тренд-структура - это
не столько средство анализа текста, сколько средство выхода за рамки мышления
автора, максимально полное использование интеллектуальных ресурсов текста для
собственных "корыстных" задач объяснения. 
Аксиология
Путем обобщения выделяются
главные ценности, главные правила, главные предметы оценивания  и главные оценки, которые фиксируются таким
же образом в пространственном расположении в виде рисунка: Правила:  1) 2) Ценности: 1) 2) Предметы оценки: Оценки: 1) 2)
                       
 
Пример проведения
контент-анализа
            В этой части курсовой работы  я 
хочу привести пример того, каких результатов можно достичь  при использовании контент-анализа.  Так как я сам еще не  являюсь опытным исследователем и не могу
сделать такой комплексный анализ, то я решил использовать в качестве примера
проведения исследования  контент-анализ
высказываний г-на Березовского. Он был опубликован  в журнале "Эксперт" № 6 1999 г., авторы: Л.Сафразьян и
Т.Сафразьян.       
            Основной
задачей было выявление невыраженной информации о Березовском.  Для обработки текстов  была разработана специальная  категориальная схема, в  которой учитывались различные  группы объектов,  отражающие  сущностные
стороны  представлений
Березовского.  Это географические
названия, терминология, имена 
государственных и иных деятелей, различные темы и  т. д. 
С целью   выяснения отношения   к ним Березовского 
учитывалась  эмоциональная
окраска  того или иного понятия, термина
или темы.   В дальнейшем   производилась статистическая обработка
результатов кодировки и сопоставлялись 
результаты по  разным
тематическим фонам.
Россия и Запад
            В 
интервью и статьях   Березовский
подает  себя прежде всего как российский
политик. Если мы посмотрим  на
выраженную   информацию  этих материалов, то  в центре внимания Березовского – Россия и ее
благополучие. Как исполнительный секретарь 
СНГ Березовский, казалось бы, должен уделять  большое  внимание
соответствующим странам. Результаты контент-анализа рисуют куда более сложную
картину.
            Россию
Березовский называет чаще, чем другие страны. Но даже по общей  сумме упоминаний баланс положительных и   отрицательных оценок примерно одинаков, что
уже само по себе  не дает  оснований говорить о положительном отношении
к стране. Речь  может идти только о
повышенном внимании.
            Если
же  оценить  не только частоту  и
характер упоминаний, но и то, в каком контексте упоминается страна, то
оказывается, что Березовский относится к России  негативно. Когда Россия упоминается в связи с принятием
каких-либо ответственных решений или Березовский говорит  о ней, характеризуя    свою систему   политических,  моральных
или  иных  ценностей, все его высказывания 
носят либо нейтральный, либо 
негативный характер. Более того, Россия – единственная страна, к  которой выявлено негативное отношение  по 
решающим тематическим фонам.
            Явную
положительную реакцию у Березовского вызывают западные страны. Прежде всего
США, Израиль, Великобритания и Швейцария.
            Анализ
же высказываний, связанных  со странами
СНГ , показывает:  и по частоте
упоминаний, и по эмоциональности эти страны существенно уступают как России,
так и Западу, что весьма странно для исполнительного секретаря СНГ.
            Похожую
картину дает анализ упоминаний наций. 
Негативные  упоминания
встречаются у Березовского  в отношении  русских, чеченцев, немцев и кубинцев.
Однозначно положительную  реакцию  вызывают 
евреи и американцы. Ни одна из наций стран СНГ (за исключением России)
не упоминается вовсе.  Таким образом,
российский политик и исполнительный секретарь 
СНГ Борис Березовский 
отдает  явное предпочтение
Западу, а не России, а страны СНГ и вовсе находятся на периферии его
внимания. 
Однако ничего
конкретного об интересах Березовского на Западе узнать не удалось.  Березовский называет большое  количество персоналий – 101. Восемьдесят
пять из них – граждане России. При том, что западные страны вызывают повышенное
и устойчивое внимание Березовского, тот факт, что он практически  не упоминает  имен, имеющих отношение к этим странам, удивляет. Отсюда можно
сделать вывод: все деловые и значимые политические контакты на Западе для
Березовского – зона его  повышенного
контроля.
Политик или бизнесмен?
           
            Березовский
343 раза упоминает российских политиков и только пять раз  - российских  бизнесменов. Точно также  
он избегает  называть  по именам 
бизнесменов западных. Это странно, поскольку  вообще о проблемах 
рыночной экономики  он говорит
много и с удовольствием. Но несмотря на то что бизнесменов Березовский называет
крайне редко, их имена всегда упоминаются в рамках крайне важного тематического
фона, связанного с принятием 
ответственных решений.
            В
политике другое дело. Называется огромное количество имен, указывающих на самые
разнообразные  контакты, в то время как
фигур, упоминаемых в связи с ответственными решениями,  мало. Вывод очевиден:   вопросы, связанные с бизнесом, затрагивают
Березовского глубоко и серьезно.
            Крайнюю
скрытность Березовского-бизнесмена подтверждает и  ничтожно малое количество упоминаний компаний и фирма – девять
упоминаний всего семи компаний.   Однако
из семи компаний четыре упомянуты в связи с принятием  ответственных решений. Точно так же, как и в случае с
персоналиями, тематический фон вскрывает подлинные интересы Березовского. Для
сравнения укажем, что по тематическому фону "система принятия
решения" не прошло ни одно название органов власти, политических партий и
движений. Отсюда вывод: для Березовского 
собственно политическая   сфера
играет намного меньшую роль, чем деловые интересы.  Однако картина не так проста, как может показаться на первый
взгляд. Конечно, Березовский в первую очередь бизнесмен. Но  политика для него не просто "служанка
экономики", это самостоятельная и важная сфера самореализации. Причины
занятий Березовского политикой лучше искать не в  прямой материальной выгоде, а в особенностях его отношения к
миру.
Философ-практик
            Для того чтобы глубже понять
Березовского  как человека,  обратимся к анализу употребляемых им
терминов, понятий и тем, в которых раскрываются наиболее  фундаментальные  особенности личности. У Березовского отмечено 68 упоминаний,
относящихся  к сфере
религиозно-философской терминологии.  По
тематическому  фону "система
принятия решений"  здесь  проходит 
четыре сигнала (почти 6 процентов от обще суммы сигналов). Этот
показатель  приближается  к соответствующему проценту по фону в
бизнес-терминологии. Следовательно, философско-научный  контекст при принятии конкретных
решений  для Березовского почти так же
важен, как и бизнес-контекст.
            Понятие
Бога – наиболее значимое понятие в внутреннем 
пространстве  Березовского. При
этом  Березовский ни разу не упомянул  ни одной конкретной  религии или религиозного течения.
Следовательно, понятие Бога не связано во внутреннем пространстве  Березовского ни с одной  из традиционных религий.
            Противоречия  здесь нет, дальнейший анализ показывает, что
Бог Березовского далек от традиционных  религиозных  представлений.  Скорее это Бог Лапласа, который, зная начальные условия для
каждой частицы и законы движения,  может
вычислить судьбу Вселенной. "Я 
никогда не выстраиваю ненадежных систем", - это принципиальная
позиция Березовского. Бог Березовского – это прежде всего универсальная
мобильная структура – развивающаяся "надежная система".  При этом сам Березовский выполняет  функции 
активного творца этой структуры.
            Тематический
контент-анализ  также показал, что
Березовский  стремится преобразовать
социум, устанавливая свои "правила игры". Среди всех тем,
объединенных  общим названием
"система  ценностей по отношению к
обществу", по теме 
"создание  собственных
правил игры в социуме" прошло 17 сигналов из 38 (44,74 процента). Это
слишком много, чтобы просто обозначить пусть даже и очень важную позицию.  Избыточность  информации по данной теме не может быть объяснена  стремлением создать благоприятный имидж –
намерения слишком опасны для прямой рекламы. 
Скорее, это следствие 
глубокой  укоренённости данной
темы во внутреннем пространстве Березовского. С нашей  точки зрения, она – доминантный фактор, который  будет иметь большое значение в  ходе принятия Березовским любых решений.
            Итак,
Березовский не столько политик, сколько бизнесмен и , как это ни парадоксально,
своеобразный философ-практик. Он активно действует в социуме, создавая свои
"системы", которые работают по тем правилам, которые он  разрабатывает  для них. Это способ 
действия достаточно  надежный,
поскольку системы Березовского  - это,
образно говоря, набор поплавков, которые удерживают  его на поверхности в любой ситуации. На их создание  он тратит много усилий, но они оправдывают
себя именно в критических ситуациях.  И
в этом он принципиально отличается от подавляющего большинства российских
политиков, которые не создают "системы" а преследуют локальные  цели - 
занять те  или иные  позиции в пирамиде власти. Но даже  реализуя 
свои цели, они не могут обеспечить себе таких гарантий устойчивости,
которые создает для себя Березовский.
ЗАКЛЮЧЕНИЕ
             При обработке  массивов данных    в
настоящее время применяются разнообразные математические методы. В   большинстве своем они  могут  
оперировать только с числовыми переменными, над которыми  производятся привычные   операции. Но гораздо большее количество
информации  содержится в  текстовых  
источниках.  Ее   довольно сложно, а иногда и невозможно
преобразовать  в числовой формат,
поэтому становится актуальной проблема разработки таких методов анализа
подобной информации, чтобы можно было извлекать полезные сведения из  неоднородной текстовой информации.  В  данной курсовой работе    и
была показана возможность применения контент-анализа для  обработки 
текстовой экономической информации.   В заключении хочется   еще
раз отметить, что контент-анализ  объединяет
усилия   сразу нескольких направлений  
науки: лингвисты должны составить таблицы повторяемости  словоформ, психологи указать на силу и
важность связей между этими словоформами, а 
математики должны провести статистический анализ   входящего текста на основе  имеющихся   таблиц слов.  
            В
будущем   мне хотелось бы   создать  
универсальный пакет для проведения контент-анализа   текущих экономических новостей, которые появляются
в сети Интернет.

Рефераты. Контент анализ экономической    информации
Рекомендуем


Рефераты. Контент анализ экономической    информации