Зрение

+5
Просмотров: 1 632 2-12-2015, 16:09 Медицина и здоровье / Разное 0 комментариев
Зрение
В нашей сегодняшней статье:
Зрение

Кодирование информации в зрительных клетках.

Исследование Куффлера
показало, как информация кодируется ганглиозными клетками. Эти клетки обычно генерируют разряды с определенной самопроизвольной частотой, даже когда на глаза не воздействует свет. Для некоторых ганглиозных клеток, если свет попадает на маленькую область сетчатки, будет отмечаться увеличение частоты генерации разрядов. Но если свет падает на область вокруг этого чувствительного центра, самопроизвольная частота генерации разрядов снижается. Свет, падающий в отдалении от центра, вообще не вызывает никакой реакции. Эти клетки известны как релейные. Существуют также релейные ганглиозные клетки, у которых самопроизвольная частота разрядов снижается, когда свет попадает в центр, « увеличивается, когда свет падает в окружающую их область. Рисунок 2.5 иллюстрирует восприимчивые области этих клеток. Подобным же образом реагируют клетки в латеральном коленчатом теле.

Хьюбел и Визел в их исследовании первичной зрительной коры у кошек обнаружили, что клетки зрительной коры реагировали более сложным образом, чем клетки более низкого уровня. На рисунке 2.6 изображены четыре из паттернов, которые наблюдались в корковых клетках. Как можно заметить, все эти рецептивные поля имеют удлиненную форму, в отличие от релейных клеток. Типы, показанные в частях а и б, — детекторы края. Они положительно реагируют на свет с одной стороны линии и негативно — с другой стороны. Они будут реагировать максимально, если имеется край света, выровненный так, что он падает в пограничную точку. Типы, показанные в частях в и г, — детекторы полос. Они положительно реагируют на свет в центре и негативно — на периферии, или наоборот. Таким образом, полоса с положительным центром будет реагировать максимально, если имеется полоса света, покрывающая лишь центр. 

И детекторы края, и детекторы полос специфичны относительно положения, ориентации и ширины. То есть они реагируют только на стимуляцию маленькой области поля зрения, на полосы и края определенной ориентации и на полосы и края определенной ширины. Так, полосатый паттерн, подобный изображенному на рисунке 2.7, будет возбуждать специфический детектор полос, пока полосы имеют ориентацию и ширину, соответствующую этому детектору. Но различные детекторы, по-видимому, настроены на разную ширину и ориентацию, и поэтому любой такой паттерн оказывал бы максимальное стимулирующее воздействие на определенный набор детекторов полос.


 

Рисунок 2.8 иллюстрирует, как могут объединяться несколько релейных клеток, чтобы образовывать детекторы края или полос. Обратите внимание, что отдельной релейной клетки недостаточно, чтобы стимулировать детектор. Скорее, детектор реагирует на паттерны релейных клеток, и поэтому даже на этом низком уровне мы видим, что нервная система обрабатывает информацию в терминах паттернов нервной активации.

На рисунке 2.9 показано представление клеток в первичной зрительной коре в виде гиперколонн, данное Хьюбелом и Визелом. Они обнаружили, что зрительная кора разделена на области размером 2x2 миллиметра, которые они назвали гиперколоннами. Каждая гиперколонна представляет определенную область перцептивного поля. Зрительная кора имеет топографическую организацию, и поэтому смежные области поля зрения представлены в смежных гиперколоннах. На рисунке 2.9 показано, что каждая гиперколонна сама имеет двухмерную организацию. В одном измерении имеются чередующиеся ряды, получающие информацию от левого и правого глаза. В другом измерении клетки различаются по ориентации, к которой они наиболее чувствительны.


Смежные области представляют подобную ориентацию. Удивительно, как много информации кодируется в зрительном анализаторе. Мы имеем сотни областей пространства, отдельно представленных для каждого глаза, и в пределах этих областей представлены много различных ориентаций. Кроме того, и это не отражено на рисунке, для кодирования каждого размера и ширины линии имеются определенные клетки. Таким образом, к моменту, когда зрительный сигнал достигает коры, из него уже извлечено огромное количество информации.

В дополнение к этой богатой репрезентации ориентации линии, зрительная система извлекает и другую информацию из зрительного сигнала. Например, мы можем также чувствовать цвет объектов и их движение. Ливингстон и Хьюбел предположили, что все эти различные измерения (форма, цвет и движение) обрабатываются зрительной системой отдельно. Имеется много различных зрительных путей и различных областей коры, связанных со зрительной обработкой, — 32, по мнению Эссена и Дейо. В различных путях есть клетки, дифференциально чувствительные к цвету, движению и ориентации. Очевидно, зрительная система анализирует стимул по многим независимым особенностям и имеет локализацию этих особенностей. Такие пространственные репрезентации особенностей называются картами особенностей. Так, если вертикальная красная полоса перемещается в определенное место, имеются отдельные карты особенностей, репрезентирующие, что нечто красное и вертикальное перемещается в данное местоположение, и эти карты могут находиться в различных зрительных областях мозга.

Ганглиозные клетки кодируют поле зрения в единицах релейных клеток, которые, объединенные в результате высшей зрительной обработки, формируют различные особенности.

Восприятие глубины и поверхностей.

Даже после того, как зрительная система идентифицировала края и полосы в окружающей среде, должно быть обработано еще много информации, прежде чем зрительная система будет способна воспринимать мир. Одна из проблем, которую она должна решить, состоит в определении того, где эти края и полосы находятся в пространстве. Фундаментальная проблема состоит в том, что информация, размещенная на сетчатке, изначально двухмерна, в то время как мы должны строить трехмерную репрезентацию мира. Имеется несколько признаков того, что зрительная система обрабатывает информацию, чтобы определить расстояние. Один из них — градиент текстуры. Элементы обычно кажутся более близкими друг к другу по мере того, как увеличивается расстояние от наблюдателя. Рассмотрим классические примеры Гибсона на рисунке 2.10. Даже при том, что это плоская поверхность, изменение в текстуре создает впечатление расстояния. Другой признак глубины — стереопсис, который выражается в том факте, что два глаза получают слегка различные изображения мира. Трехмерные очки, которые используют в некоторых кинотеатрах и при других демонстрациях, зависят от этого факта. Они фильтруют свет, приходящий от отдельного двухмерного источника (такого, как экран в кинотеатре) так, что на разные глаза приходит различная информация. Восприятие трехмерной структуры в результате стереопсиса может весьма впечатлять.

Третий убедительный источник информации о трехмерной структуре основан на том, что называется двигательным параллаксом. Изображение отдаленных точек движется по сетчатке медленнее, чем более близких. Точно так же, когда человек поворачивает голову, изображение объектов, которые более отдалены, будет двигаться по сетчатке медленнее, чем близких. Интересно продемонстрировать это, посмотрев на листья какого-нибудь дерева или кустарника, закрыв один глаз. Без стереоскопической информации возникнет ощущение очень плоского изображения, в котором трудно увидеть положение многих листьев относительно друг друга. Если переместить голову, то внезапно трехмерная структура дерева становится вполне очевидной и нетрудно оценить положение листьев и ветвей относительно друг друга.

Хотя легко показать важность для восприятия глубины признаков, подобных градиенту текстуры, стереопсису и двигательному параллаксу, все же довольно трудно понять, как мозг на самом деле обрабатывает такую информацию, чтобы были возможны эти убедительные демонстрации. Некоторые исследователи в области машинного зрения работали над проблемой того, как это действительно делается. Например, Дэвид Марр сделал важное предположение, что эти различные источники информации работают вместе, чтобы создать то, что он назвал эскизом 2 1/2-D, который идентифицирует, где находится различные зрительные особенности относительно наблюдателя. Но он понял, что это представление сильно отличается от фактического восприятия мира. В частности, такая репрезентация представляет лишь части поверхностей и не позволяет определить, как они сочетаются, чтобы выделять объекты из окружающей среды. Он использовал термин модель 3-D, чтобы обозначить репрезентацию объектов в этой сфере.

Такие признаки, как градиент текстуры, стереопсис и двигательный параллакс, сочетаются для создания репрезентации местоположения поверхностей в трехмерном пространстве.

Восприятие объектов.

Главная проблема в вычислении такой репрезентации мира — сегментация объекта. Знания того, где линии и полосы расположены в пространстве, недостаточно. Мы должны знать, которые из них сочетаются друг с другом, чтобы образовывать объекты. Рассмотрите изображение на рисунке 2.11. Имеется много линий, расположенных под разным углом, но некоторым образом мы соединяем их вместе, в результате чего воспринимаем набор объектов.

 

Мы склонны организовывать объекты в элементы согласно набору принципов, называемых принципами организации гештальта, поскольку первыми их предложили гештальт-психологи. Рассмотрите рисунок. 2.12.

В части «а» мы воспринимаем четыре пары линий, а не восемь отдельных линий. Этот рисунок иллюстрирует принцип близости: близкие друг к другу элементы имеют тенденцию объединяться в единое целое. Часть «б» иллюстрирует принцип сходства. Мы склонны видеть этот набор элементов как ряды из ноликов, чередующиеся с рядами из крестиков. Сходные по виду объекты имеет тенденцию группироваться вместе. Часть «в» иллюстрирует принцип хорошего продолжения. Мы воспринимаем две линии АВ и CD, хотя нам ничто не мешает воспринимать этот рисунок как другую пару линий — AD и СВ. Но линия АВ показывает лучшее продолжение, чем линия AD, которая имеет излом. Часть «г» иллюстрирует принципы замыкания и хорошей формы. Мы видим на этом рисунке один круг, закрытый другим, хотя закрытый объект мог бы иметь много других возможных форм.

Согласно этим принципам обычно организовываются в единицы даже совершенно новые стимулы. Палмер изучал распознавание испытуемыми фигур типа изображенных на рисунке 2.13. Сначала он предъявлял испытуемым стимулы, такие как показанный в части «а», и затем просил, чтобы они решили, были ли фрагменты от «б» до «д» частью первоначальной фигуры. Стимул в части «а» имеет тенденцию организовываться в треугольник (замыкание) и согнутую букву «п» (хорошее продолжение). Палмер обнаружил, что испытуемые могли опознавать части наиболее быстро, когда это были сегменты, предсказанные принципами гештальта.

Так, стимулы в частях «б» и «в» были распознаны более быстро, чем стимулы в частях «г» и «д». Таким образом, мы видим, что распознавание критически зависит от начальной сегментации фигуры. Распознавание может быть ухудшено, когда основанная на принципах гештальта сегментация противоречит фактической структуре паттерна.

«НаПрИмЕрЭтОпРеДлОжЕнИеТрУдНоЧиТаТь»

Причины трудности состоят в том, что, согласно принципу сходства, трудно воспринимать чередующиеся прописные и строчные буквы и что, удалив пробелы между словами, мы устранили признаки, позволяющие действовать принципу близости.

Эти идеи относительно сегментации могут быть распространены на описание сегментирования более сложных трехмерных структур. На рис. 2.14 проиллюстрирован предложенный Хоффманом и Ричардсом способ пользования принципов, сходных с принципами гештальта, для сегментирования схематической репрезентации объекта на меньшие объекты. Они заметили, что там, где один сегмент присоединяется к другому, обычно имеется вогнутость. По существу, люди используют принцип хорошего продолжения: линии в точках вогнутости не являются хорошим продолжением друг друга и поэтому не группируют эти части вместе.

Мы обсудили обработку зрительной информации до момента, когда положение и форма объектов определены в трехмерном пространстве. Современный взгляд на эту проблему состоит в том, что обработка зрительной информации, которая лежит в основе этой способности, в значительной степени носит врожденный характер. Младенцы, по-видимому, способны к распознаванию объектов и их формы и к оценке местоположения этих объектов в трехмерном пространстве.

Принципы организации гештальта используются, чтобы сегментировать изображения на объекты.

Вы должны это прочесть
Подтвердите что вы не робот:*