Каталог / ЕКОНОМІЧНІ НАУКИ / Статистика
скачать файл:
- Назва:
- Авдушева Надежда Евгеньевна. Дифференциация населения и определение границ распространения бедности на основе нечеткой классификации
- Альтернативное название:
- Авдушева Надежда Евгеньевна. Дифференціація населення та визначення границь розподілених категорій є основою на початковій класифікації
- Короткий опис:
- Авдушева Надежда Евгеньевна. Дифференциация населения и определение границ распространения бедности на основе нечеткой классификации : Дис. ... канд. экон. наук : 08.00.11 : СПб., 1999 169 c. РГБ ОД, 61:00-8/525-X
Содержание к диссертации
Введение
Глава 1.Изучение дифференциации населения и оценка уровня бедности как решение задачи классификации12
1.1. Бедность как объект социально-экономических исследований и методика оценки границ ее распространения 12
1.2. Оценка уровня бедности как задача классификации 17
1.3. Сущность и основные подходы к решению задачи классификации 19
1.4. Реализация вероятностно-статистического подхода 23
1.5. Методы кластерного анализа 26
1.6. Разбиение выборочной совокупности на нечеткие кластеры 35
1.7. Обоснование выбора алгоритма классификации для решения задачи определения уровня бедности 40
Глава 2.Исследование свойств алгоритма разбиения многомерной совокупности на нечеткие подмножества43
2.1. Вычислительная схема алгоритма 43
2.2. Начальное приближение матрицы степеней принадлежности 48
2.3. Задание критерия окончания расчетов 55
2.4. Параметр настройки алгоритма 57
2.5. Определение оптимального числа кластеров 62
2.6 Выбор классификационных признаков 69
Глава 3.Применение нечеткой классификации в исследовании уровня жизни городского населения России76
3.1 Постановка задачи 76
3.2. Обоснование состава информативных классификационных признаков 78
3.3. Определение количества кластеров 84
3.4 Анализ результатов классификации домохозяйств Санкт-Петербурга 87
3.5 Анализ результатов классификации домохозяйств г. Вязники 97
3.6 Исследование объектов, не вошедших в ядра выделенных кластеров 103
3.7 Исследование устойчивости полученной классификации по отношению к смене признакового пространства 108
Заключение 113
Список литературы 117
Приложениеі 122
Приложение 2 126
Сущность и основные подходы к решению задачи классификации
Обоснование выбора алгоритма классификации для решения задачи определения уровня бедности
Начальное приближение матрицы степеней принадлежности
Исследование устойчивости полученной классификации по отношению к смене признакового пространства
Введение к работе
Актуальность темы исследования
Диссертационная работа посвящена исследованию проблемы изучения бедности в России. С начала 90-х годов проблема оценки масштабов бедности, определения степени материального неравенства российских граждан стала основной темой большинства социологических исследований.
Это связано с тем, что начало экономических реформ повлекло обесценение сбережений населения, рост открытой и латентной безработицы, появление и развитие феномена хронической задолженности по заработной плате и социальным пособиям, что привело к резкому падению уровня доходов и потребления большей части населения России. В таких условиях формирование критерия отбора бедных семей, изучение реальных нужд бедного населения, определение приоритетных направлений социальной помощи приобретает первоочередную значимость.
Таким образом, разработка и применение научно-обоснованной методики определения границ распространения бедности, определение реально
существующей структуры населения по уровню удовлетворения потребностей становится особенно актуальной, требующей незамедлительного решения проблемой.
Официальная российская статистика, как, впрочем, и в большинстве
зарубежных стран, базируется на определении бедности через исчисление
среднедушевого дохода, хотя реально категория бедности связана с потреблением.
Причина такого подхода заключается в том, что информация о доходах доступна в
гораздо большей степени, чем информация о потреблении.
В условиях переходной экономики, когда расширяется занятость в неформальном секторе, приобретают распространение неденежные формы оплаты труда и предпринимательского дохода, получение достоверной информации о реальных доходах семей становится практически неразрешимой проблемой.
В диссертации предлагается метод оценки границ распространения бедности, а также определения структуры населения с точки зрения степени удовлетворения первоочередных потребностей, основанный на проведении нечеткой классификации семей по ряду социально-экономических признаков. Такого рода классификация, учитывая и доходные показатели и характеристики потребления, позволяет получить научно - обоснованную информацию, на основании которой могут быть определены социально-экономические показатели, характеризующие такой негативный социально-экономический феномен, как бедность.
Адекватность знаний о характере и зоне распространения бедности, возможно, позволит разработать конкретные социальные программы по предотвращению или смягчению деструктивных процессов, влияющих на масштаб и глубину бедности в России. Это еще раз подтверждает актуальность темы проводимого исследования.
Цель диссертационной работы состоит в разработке более обоснованной, чем это имеет место в госстатистике России, методики классификации населения по уровню жизни на основании множества социально-экономических индикаторов (признаков), использовав для выделения однородных групп, в том числе и группы «бедных», алгоритм разбиения многомерных наблюдений на нечеткие подмножества.
Для достижения данной цели в диссертации поставлены и решаются следующие задачи:
рассмотрение существующей методики классификации населения по уровню жизни, методики определения показателей, характеризующих бедность в России;
- формулировка требований, предъявляемых к научной классификации населения по уровню удовлетворения потребностей;
- выбор наиболее информативных признаков, на основании которых можно произвести обоснованную классификацию, а также показателей, характеризующих группы населения по этим признакам;
обзор излагаемых в специальной литературе методик и алгоритмов классификации многомерных наблюдений, определение метода, наиболее отвечающего стоящей задаче;
- исследование вычислительной схемы выбранного алгоритма нечеткой классификации (алгоритма Дана - Беждека), определение методики задания входных параметров алгоритма и критерия окончания расчетов; исследование влияния параметров настройки алгоритма на результаты классификации; произведение классификации на основе выборок населения Санкт - Петербурга и Вязников при помощи разработанной методики применения алгоритма нечеткой классификации;
исследование и обоснование качественной состоятельности полученных результатов классификации;
- разработка методики определения уровня бедности на основе полученной классификации;
- исследование инвариантности полученной классификации в различных признаковых пространствах;
разработка предложений по применению методики для социологических исследований по изучению уровня жизни и границ распространения бедности населения.
Объект и предмет исследования.
В качестве объекта диссертационного исследования выступает уровень жизни населения, определение границы категории «бедность» в социально экономических исследованиях.
Предметом исследования является применение метода нечеткой классификации с целью анализа уровня жизни и определения границ распространения бедности.
Методологической и теоретической основой диссертации послужили труды отечественных и зарубежных ученых, посвященные проблемам изучения бедности и социального неравенства населения, а также специальная литература, посвященная проблемам классификации многомерных наблюдений.
Информационная база и методы исследования.
При подготовке диссертационной работы источниками статистической информации послужили многомерные выборки, полученные в результате социологического обследования домохозяйств в Санкт - Петербурге и Вязниках, проведенного в 1997 г. при финансовой поддержке TASIS (проект T-95-R «Бедность в России: лишения и социальная исключенность» ) под руководством Аластера Маколи (Эссекский университет, Великобритания) и Марины Анатольевны Можиной (Институт социально - экономических проблем народонаселения (ИСЭПН) РАН, Россия). Обследование домохозяйств в С. -Петербурге проводилось коллективом
сотрудников Санкт - Петербургского Государственного Университета экономики и финансов под руководством чл. - корр. РАН Ирины Ильиничны Елисеевой.
Для первичной обработки материалов данного исследования был применен ППП «Статистика», для получения нечеткой классификации было разработано оригинальное программное обеспечение.
Научная новизна работы.
Диссертация представляет собой исследование и разработку методики изучения уровня жизни населения на основании нечеткой классификации многомерных наблюдений. Ряд положений работы в области определения структуры населения по степени удовлетворения первоочередных потребностей и уровню доходов, оценки уровня бедности, а так же в области методики построения нечеткой классификации выдвинут впервые. Научную новизну представляют:
метод изучения структуры населения на основании нечеткой классификации; метод определения уровня бедности на основании набора социально-экономических индикаторов;
- методика определения оптимального для конкретной исследуемой совокупности количества кластеров;
- методика определения начального приближения матрицы степеней принадлежности объектов к кластерам;
- способ определения наличия или отсутствия реальной структуры исследуемой совокупности многомерных наблюдений;
- методика выбора классификационных признаков, являющихся информативными с точки зрения поставленной цели классификации;
- методика выделения и исследования аномальных наблюдений.
Практическая значимость работы заключается в разработке современной методологии определения уровня бедности и структуры семей по уровню удовлетворения потребностей на основании нечеткой классификации объектов социологического наблюдения, которая может быть использована в последующих социологических исследованиях.
Предложенные в работе методические рекомендации по практическому использованию алгоритма нечеткой классификации могут оказать реальную помощь исследователям, работающим в различных прикладных областях, связанных с изучением нечетко структурируемых совокупностей наблюдений.
Апробация работы.
Основные научные положения работы нашли отражение в опубликованных научных работах диссертанта, а также доложены на совместной научной конференции Фонда Форда и Московского Центра Карнеги в апреле 1998 г.
Результаты нечеткой классификации, полученной в результате применения обсуждаемого в диссертации алгоритма, а также анализ этих результатов другими исследователями опубликованы в коллективной монографии где сделан вывод о пригодности обсуждаемого метода, в частности, для исследования проблем бедности.
Математические основы предлагаемого метода нечеткой классификации были обсуждены на научном семинаре в ЭМИ РАН, состоявшемся в октябре 1998 г.
Публикации.
Основные положения работы изложены в четырех опубликованных работах общим объемом 1,16 п.л.
Структура работы.
Диссертация состоит из введения, трех глав, заключения, списка литературы и приложений.
Во введении обосновывается актуальность темы исследования, определяются цели и задачи диссертации, дается определение объекта и предмета исследования, определяются теоретические и методологические основы работы, приводится характеристика информационной базы и методов исследования, раскрывается научная новизна, практическая значимость работы, структура исследования.
В первой главе описана постановка задачи определения структуры населения и оценки границ распространения бедности, приведен обзор существующих методов определения уровня бедности, включая официально принятую в России методику. Обоснована необходимость разработки альтернативных методов изучения бедности в современных условиях, одним из которых является выделение группы бедных семей на основе результатов многомерной классификации. Приведен обзор существующих методов разбиения совокупностей многомерных наблюдений на качественно однородные группы, введено понятие нечеткой классификации и описаны преимущества применения такой классификации для решения поставленной социально-экономической задачи.
Вторая глава посвящена изучению свойств конкретного алгоритма нечеткой классификации, а именно, алгоритма Дана - Беждека [52]. В главе приводится описание вычислительной схемы алгоритма, дается анализ зависимости результатов классификации от значений входных параметров алгоритма, излагается методика определения адекватных значений различных входных параметров.
Третья глава содержит описание результатов применения обсуждаемого алгоритма нечеткой классификации к данным конкретного социологического
обследования. Приводится качественное исследование полученных результатов классификации, характеристика каждого из выделенных нечетких кластеров исследуется устойчивость полученной классификации относительно смены признакового пространства.
В заключении изложены практические и научные результаты проведенного исследования.
Сущность и основные подходы к решению задачи классификации
Классификация является одной из фундаментальных категорий в науке. Факты и явления должны быть упорядочены прежде, чем мы сможем их понять и разработать общие принципы, объясняющие их появление и видимый порядок. С этой точки зрения классификация является интеллектуальной деятельностью высокого порядка, необходимой нам для понимания природы окружающих нас процессов и явлений. В статистических исследованиях классификация или группировка первичных данных является основой всей дальнейшей работы с собранной информацией. Для выявления существующих закономерностей, взаимосвязей между отдельными характеристиками исследуемых объектов, все имеющиеся наблюдения должны быть разбиты на качественно однородные группы.
В большинстве практических исследований каждый объект наблюдения описывается множеством характеризующих его признаков. Разбиение многомерных объектов на качественно однородные группы является сложной задачей статистического исследования.
Задача классификации состоит в разбиении различных объектов на классы "похожих". Следовательно, всякая классификация основана на интуитивном понятии "близости" или "сходства". Удачным считается такое разбиение множества объектов, при котором "похожие" объекты собираются в один класс, а "непохожие" разносятся по разным классам. Эти понятия необходимо формализовать, найти им эквивалент на языке математики [15].
Объектами называются те реальные элементы, которые могут быть представлены для классификации. При статистической постановке задачи классификации множество всех возможных объектов образует генеральную совокупность U. Выборка Х ХЬХЪ . . . Хп] - совокупность объектов, фактически подлежащих классификации. Очевидно, что XaU. Число п - объем выборки. Объекты различаются между собой некоторыми признаками (дескрипторами). Число различных признаков, характеризующих каждый объект, будем обозначать через т. Каждый у -ый признак имеет множество значений My.Совокупность значений признаков объекта составляет его описание. Множество всех возможных описаний составляет пространство М, т.е. М- ІЦ х М2х ... х Л . Классификация множества X означает разбиение его на систему непересекающихся классов S„ S2, . . . ,Sk, таких, что: Приведенное выше определение является определением жесткой, однозначной классификации, при которой каждый объект принадлежит к одному и только одному классу, и не существует объектов, не вошедших ни в один из классов. На практике, особенно в социально-экономических исследованиях, имеющих дело с плохо определенными структурами, требование однозначной классификации является очень жестким. Это обусловлено тем, что во многих случаях реальные классы размыты по своей природе, то есть переход от принадлежности к непринадлежности объектов к данному классу является постепенным, а не скачкообразным. В таких случаях имеет смысл говорить о разбиении исходного множества исследуемых объектов на определенное количество размытых или нечетких подмножеств (кластеров). Более подробно о размытых классификациях будет сказано ниже. Одну и ту же выборку можно разбить на классы разными способ
- Стоимость доставки:
- 230.00 руб