Форум кафедры иностранных языков и перевода УрФУ

Обратно на сайт

You are not logged in.

#1 2011-10-01 16:41:28

juliam981
Member

Квантитативная лингвистика

Британский Национальный Корпус. Рекомендации по использованию
Корпус содержит 100 миллионов слов.
1. Загрузите сайт http://corpus.byu.edu/bnc/
2. В правом верхнем углу найти слово регистрация, заполнить анкету (имя, адрес почты, пароль, организацию (университет, компанию или др), дополнительную информацию о том, кем являетесь - исследователем, наполовину исследователем или не исследователем - от этого зависит дальнейший статус допуска на сайт)
3. После этого вы можете зайти под своим паролем и логином и начать пользоваться сайтом
4. Слева вы увидите колонку с различными параметрами. В первой графе предлагается ввести слово или сочетание и нажать поиск. У вас выйдет количество употреблений данного слова или сочетания, а ниже можно посмотреть все варианты употребления
5. Слева кроме поиска слова или сочетания слов можно найти различные разделы корпуса (научный, газетный, журнальный и др. Можно посмотреть сколько раз данное слово употребляется в каждом из разделов. Там же есть графа сортировки по частоте, уместности и  алфавитному порядку.
6. Можно вести поиск не только по слова, но и сочетаниям, их описывающим, если слова не помним или не знаем. Каждое слово, которое мы ищем выделено в контексте - и если навести на него курсор то мы увидим его перевод.
7. Можно сохранять выведенные значения (save list), чтобы можно их было искать в дальнейшем
8. Нажав формат KWIC в левом контекстном меню, мы можем найти употребление слова, причем весь текст будет раскрашен в разные цвета - каждая часть речи в свой цвет. Чтобы посмотреть какая часть речи каким цветом обозначена нужно нажать на знак ? и посмотреть справку.

Offline

 

#2 2011-10-01 19:06:17

Lizzza
Member

Re: Квантитативная лингвистика

Корпус немецкого языка Cosmas II
NB: Пользование без регистрации невозможно
1. Заходите на сайт www.ids-mannheim.de, нажимаете справа в "Anwendungen" на Cosmas II
2. Сверху нажимаете на Anmeldung, потом сверху слева на Registrieren и регистрируетесь
3. Затем нажимаете на Recherche - исследование (сверху)
4. Потом выбираете архив (напр. письм. язык или истор.)
5. Потом выбираете корпус (можно выбрать произведения Гете, бр. Гримм, Маркса и Энгельса). Последний был бы очень актуален лет 20 назад)
6. Формулируете запрос
Примеры языка запросов:
Mond? - ? заменяет 1 букву
&-heit - все сущ. с этим суффиксом
NB: под запросом иконка Suchanfrage - помощь в оформлении запроса
7. Результаты поиска Вы можете смотреть в формате КВИК, либо в полнотекстовом режиме (Volltext). Также Вы можете экспортировать их на свой компьютер
Либо произвести  контекстный анализ (Kookkurenzanalyse)
Всем успехов в покорении немецкого языка и немецкого корпуса :)

Last edited by Lizzza (2011-10-01 19:19:02)

Offline

 

#3 2011-10-02 19:54:06

Ivan
Member

Re: Квантитативная лингвистика

"Корпус" Google
Адрес: books.google.com/ngrams
Ищет только употребляемость фраз от одного до пяти слов, в определенном году. Ищет только по книгам. Зато база насчитывает более 155 млрд слов.
Первое поле, это то, что вы ищите. Обратите внимание, что написанное чувствительно к регистру, т.е. "Москва" не равно "москва" и результаты поиска будут разными. Через пробел можно вводить словосочетания не более пяти слов. Через запятые можно вводить несколько запросов одновременно, что бы в одной системе отрисовалось несколько графиков.
второе и третье поля - от какого, и до какого года вы ограничиваете область поиска. Четвертое поле - корпус языка, из которого берутся результаты. Последнее, пятое поле, это коэффициент аппроксимации, т.е. сглаживания. Если в этом поле стоит ноль - отрисованный график будет максимально истинным, по сути это будут конкретные точки, соединенные линиями. Учитывая погрешности, с такими параметрами у вас есть шикарная вероятность получить не наглядный и бесполезный забор. Что бы сгладить не нужные пики (ложные выбросы) вы можете увеличить параметр сглаживания, но помните, сглаживая ложные пики, вы так же избавляетесь и от пиков истинных, оправданных. Нужное значение этого параметра всегда где-то посередине, смело подгоняйте внешний вид графика под то, что вам понравится.
Если во фразе "Run your own experiment! Raw data is available for download here." кликнуть на "here" вы попадете на страницу, где сможете поархивно скачать всю базу google. Отличие информации в архивах - наличие цифр, вы сможете создать таблицу ваших результатов, а не просто график-картинку. Но конечно работать с неструктурированными друг относительно друга архивами (хотя внутри архива, фразы уложены по алфавиту) это задачка непростая и довольно утомительная.

Offline

 

#4 2011-12-08 20:52:43

administrator
Administrator

Re: Квантитативная лингвистика

Напоминаю, что  зачет выставляется по представлению магистрантом аналитической записки, включающей:

1. Список журналов по тематике исследования. Лонг-лист, анализ специфики. Обоснование формирования шорт-листа. Шорт-лист, уточнение тематической и издательской политики.

2. Анализ формата публикаций в изданиях из шорт-листа. Объем, структура, оформление ссылок и библиографического списка. Представление экспериментального и/или практического материала.

3. Формирование списка ключевых слов по тематике вашего исследования (русский язык). Словарный, корпусный поиск эквивалентов на языке публикаций. Обоснование выбора вариантов.

4. Формирование корпуса научно-исследовательских статей по тематике исследования  (по результатам поиска в  базах данных научных публикаций в соответствии со списком  ключевых слов).

5. Анализ и реферирование отобранных статей. Анализ формата и структуры Abstract

6. Написание примерной аннотации готовящейся магистрантом статьи и защита варианта перевода ее на иностранный язык публикации.

Offline

 

#5 2011-12-09 18:26:22

juliam981
Member

Re: Квантитативная лингвистика

А можно узнать по пункту 6? я так понимаю мы должны написать Abstract к статье и перевести его на английский и прийти защитить его к вам?
по другим пунктам мы же это все уже сдавали. Часть на парах, часть на почту высылали. И к какому сроку это нужно сдать? К 26 декабря

Offline

 

#6 2011-12-09 19:24:11

administrator
Administrator

Re: Квантитативная лингвистика

Юля, вы это НЕ сдавали. Вы показывали, как движется работа, и на основании этого получали аттестацию. Сейчас, для получения зачета, вы должны представить весь материал целиком: не просто ссылки на статьи и на страницы редакций выбранных журналов, а текстовый документ, в котором все четко прописано. Пункт 5 должен быть представлен в таком виде, чтобы его потом можно было целиком включить в магистерскую диссертацию (как часть теоретической главы).

Abstract недостаточно просто перевести. Его надо перевести в ТОЙ ЖЕ модели, в которой написаны Abstract в отреферированных вами статьях. Поскольку материал у вас был собран разный и по разным тематикам, то формат тоже может получиться разный.

А защитить передо мной - значит отвветить на мои вопросы, если они возникнут :)

Мы действительно бОльшую часть работы уже делали на занятиях (к сожалению, не все присутствовали). Если вы все задания в ноябре  довели до конца,  то работы осталось немного.

Ведомости будут готовы к 16 декабря. Сдавать можно раньше - как только будет готов анализ. Я в университете каждый день.

Offline

 

#7 2011-12-15 17:00:58

juliam981
Member

Re: Квантитативная лингвистика

Надежда Семеновна!
в какое время можно будет подойти к вам в среду 21 декабря?

Offline

 

#8 2011-12-15 17:03:45

administrator
Administrator

Re: Квантитативная лингвистика

После второй пары на кафедру

Offline

 

#9 2011-12-23 14:25:20

juliam981
Member

Re: Квантитативная лингвистика

я подойду в понедельник 26.12 после второй пары

Offline

 

Board footer

Написать администратору
© Copyright 2002–2005 Rickard Andersson