Элективный курс "Обработка текстовой информации"

А. А. Зубрилин, канд. филос. наук, доцент кафедры информатики и ВТ Мордовского государственного педагогического института им. М. Е. Евсевьева, г. Саранск. Класс: X или XI. Количество часов: 68 (2 ч в неделю). Профили: физико-математический, технологический.

Место курса в образовательном процессе

Одной из быстроразвивающихся наук современности является информатика — наука о методах представления информации и способах ее обработки техническими вычислительными средствами. Учащиеся на школьных занятиях по информатике должны изучать специфику основных видов информации — числовой, текстовой, графической — и способы работы с каждым из них как с помощью, компьютера, так и без него.
В базовом курсе информатики перечисленным видам информации уделяется пристальное внимание: решаются числовые задачи на компьютере; набираются и оформляются документы, в том числе с внедрением мультимедийных объектов; формируются базы данных; составляются электронные письма; строятся изображения плоскостных и пространственных объектов; анимируются процессы и т. д. В большинстве указанных операций реализуется работа с информацией, а не ее обработка — процесс преобразования объектов, приводящий либо к количественному (уменьшение или увеличение исходных данных), либо качественному (изменение габаритов, формата записи) их изменению. Внимание учащихся направляется преимущественно не на способы выполнения операций, а на алгоритмы их реализации. Если об обработке числовой информации речь ведется постоянно, то обработка текстовой информации практически не рассматривается. Некоторые педагоги на своих занятиях пытаются сделать акцент на данной операции, но обычно это происходит косвенно и преимущественно при изучении языков программирования. Между тем через изучение способов обработки текстовой информации можно, во-первых, обобщить знания обучаемых по теме «Языки программирования»; во-вторых, реализовать внутрипредметные связи с разделом «Программное обеспечение компьютера» («Системное ПО», «Прикладное ПО») и межпредметные связи с дисциплинами филологического профиля («Русский язык», «Литература»); в-третьих, привить интерес к информатике.
Преодолению указанных недостатков может способствовать изучение элективного курса «Обработка текстовой информации на компьютере». В нем уточняются понятийная база и терминология; происходит отработка навыков работы с рядом прикладных программных средств (языки программирования, табличные процессоры); закрепляются умения решения задач внутри- и межпредметного характера; углубляются знания об этапах поиска и замены символов, упорядочивания данных, выделения одних объектов в составе других, изменения шрифтового оформления, сохранения информации на внешних носителях и т. д.

Концепция курса

Курс носит практико-методологический характер и базируется на ряде ключевых понятий, связанных с обработкой текстовой информации на компьютере. Данные понятия условно подразделяются на «объекты текста» и «операции над объектами текста». В первую группу входят термины «символ», «буква», «сочетание символов», «слово», «предложение», «текст»; во вторую — «поиск символов», «формирование текста», «вырезка», «удаление», «вставка», «замена», «подсчет», «кодирование».
Минимальной единицей текста является символ — любой используемый знак. Символ определенного алфавита называется буквой, а последовательность рядом стоящих символов — сочетанием символов. Более сложны термины «слово» и «предложение»: слово — последовательность символов, слева и справа отделяемая разграничителями (справа — любым знаком препинания или пробелом, слева — пробелом); предложение — группа символов, начинающаяся с заглавной буквы и оканчивающаяся знаками препинания «.», «...», «!», «?». Максимальная единица текста — собственно текст, представляющий любой набор символов.
Суть понятий второй группы:
поиск символов — нахождение нужного символа по заданному шаблону из исходного набора символов;
формирование текста — группировка символов в последовательность символов по определенным условиям;
вырезка — извлечение из исходной строки части данных для дальнейшего их использования в качестве самостоятельного объекта;
удаление — извлечение из исходной строки части данных для дальнейшего использования оставшейся части строки в качестве самостоятельного объекта;
вставка — добавление заданного набора символов в определенную позицию;
замена — нахождение заданных символов и подстановка вместо них других символов;
подсчет — определение количества вхождений заданного символа или последовательность символов в исходном тексте:
кодирование — замена одних символов другими.
Перечисленные понятия должны быть обязательно доведены до учащихся перед решением задач и проиллюстрированы.
При реализации практической части курса используются два прикладных программных средства — система программирования, связанная с языком Бейсик, и табличный процессор Excel. Из большого количества возможностей данных средств учащиеся должны овладеть теми, которые явно или косвенно связаны с обработкой текстовых данных: символьные функции, способы реализации алгоритмических структур, операции над текстовыми данными (слияние, сравнение) и т. д.
При решении задач на обработку текстовой информации следует придерживаться их определенной классификации. Мы предлагаем классифицировать задачи по работе со структурными элементами текста, выделяя шесть классов:
• задачи на обработку символов и текстов (минимального и максимального структурных элементов);
• задачи на обработку слов и предложений;
• задачи на обработку букв, в том числе с использованием кодов символов;
• задачи на использование массивов при обработке структурных элементов текста;
• задачи на файлы при обработке структурных элементов текста (дополнительный материал);
• задачи на динамику в алфавитно-цифровом (текстовом) режиме (дополнительный материал).

Учебные цели и задачи курса

• Формирование понятийной базы, связанной с обработкой текстовой информации на компьютере, и умений решения соответствующих задач с использованием систем программирования и табличных процессоров;
• выработка умений соотносить задачи на обработку текстовой информации с одним из классов задач;
• отработка навыков реализации алгоритмических структур средствами языка программирования Бейсик и табличного процессора Excel;
• знакомство с возможностями языка программирования Бейсик и табличного процессора Excel по обработке текстовой информации;
• демонстрация межпредметных связей информатики с другими дисциплинами;
• утлубление навыков решения задач на обработку текстовой информации.

Формы организации учебных занятий

Изложение курса можно проводить по-разному. Мы предлагаем использовать два варианта: первый заключается в параллельном изложении решения задач на языке программирования Бейсик и средствами табличного процессора Excel, второй предполагает рассмотрение решений сначала с помощью одного программного средства, потом другого. Оба варианта имеют свои преимущества и недостатки, частично приведенные в таблице.

Вариант изложения Плюсы Минусы
Параллельное изложение Сопоставление возможностей обоих программных средств, выбор оптимального пути решения задачи, количественное сокращение времени на изучение материала При низком уровне абстрагирования и неумении сопоставления фактов возникают сложности в усвоении материала и пробелы в формировании соответствующих умений
Последовательное изложение Более глубокое изучение возможностей каждого из программных средств по отдельности Неумение сопоставлять преимущества программных средств с последующим выбором оптимального пути решения, фрагментарность материала

Учителю предлагается выбор варианта изложения курса с учетом специфики контингента учащихся и профиля класса.
При изучении курса используются два типа занятий — лекции и практические занятия. Основной единицей курса является блок уроков, охватывающий решение определенного класса задач. Каждый блок предваряет одночасовая лекция, на которой учителем объясняются применяемые в блоке понятия, способы и методы решения задач средствами систем программирования и табличного процессора Excel. Последующие занятия блока — практические. Они начинаются с разбора задач. Учитель может либо сам продемонстрировать решения, либо рассмотреть их через постановку проблемной ситуации или игровой метод. Дальнейшая роль учителя сводится к выдаче задач и консультированию учащихся при выполнении этих задач. По возможности следует использовать стандартные задачи, усложняемые постановкой дополнительных подзадач. Разнообразить деятельность учащихся можно через решение творческих задач и задач с межпредметным содержанием. Каждое из заданий выполняется с помощью систем программирования и табличного процессора Excel.
По завершении решения блока задач учащимся предлагается обобщающая контрольная работа на проверку степени усвоения материала. В нее входят теоретические вопросы и практические задания. При таком подходе учителю легко проверить уровень знания теоретического материала и умение применять это знание на практике.
В рамках курса учащиеся получают задачи для самостоятельного решения. Их выполнение проверяется либо на одном из занятий, когда ученик излагает присутствующим процесс решения, либо во внеурочное время.
В конце курса проводится итоговый контроль. Он может проходить в форме тестирования, выполнения творческих заданий или с применением кроссвордной технологии.
( См.: Зубрилин А. А. Решение кроссвордов как способ проверки знаний // Информатика и образование. 2002. № 8.)

 

Минимально необходимый уровень знаний и технологических умений учащихся перед прохождением курса

Учащиеся:
• владеют одним из языков программирования высокого уровня и знают правила работы в табличном процессоре Excel;
• знают возможности встроенных функций табличного процессора Excel и умеют применять эти функции при реализации решения задач;
• владеют информацией о таблице кодов ASCII;
• умеют копировать данные в табличном процессоре Excel, имеют представление об относительных и абсолютных ссылках;
• знают виды диаграмм и умеют строить их средствами табличного , процессора Excel;
• умеют реализовывать алгоритмы ветвления и циклической обработки данных средствами языков программирования и табличного процессора Excel;
• имеют представление об анимации.

Содержание обучения

Возможности табличного процессора Excel и систем программирования по обработке текстовой информации.
Текстовые функции. Функции обработки текстовых данных. Функции преобразования типов данных. Функции дополнительного назначения.
Структурные элементы текста и способы их выделения.
Реализация стандартных операций с текстовой информацией на компьютере.
Классификация задач на обработку текстовой информации.

Решение задач с использованием понятий «символ» и «текст».
Способы перебора символов. Палиндромы.
Способы замены символов в тексте: непосредственная замена, замена через формирование нового текста, замена с минимальным перебором.
Поиск вхождения заданного символа. Когда использовать цикл FOR...NEXT, а когда цикл IF...THEN...ELSE?

Решение задач с использованием понятий «слово» и «предложение».
Что такое «слово». Способы выделения слов из текста и предложения. Поиск слов заданной длины. Удаление заданных слов или слов заданной длины из текста.
Способы подсчета заданных слов в тексте: алгоритмический, с использованием определения. Подсчет доли букв в тексте. Визуализация ответа через вывод диаграмм.
Способы замены в тексте одних слов другими: слова одинаковой длины, слова различной длины.

Решение задач на обработку символов и их сочетаний с использованием кодов символов.
Коды символов для IBM-совместимых компьютеров. Принцип кодирования.
«Символьные» числа. Обработка числовой информации с использованием методов обработки символьных величин.
Упрощение обработки прописных и строчных букв, букв русского и латинского алфавитов через применение кодов символов.

Решение задач на обработку структурных элементов текста с применением массивов.
Массив и его характеристики. Характеристики элементов массива. Заполнение массива и вывод его элементов.
Упрощение обработки прописных и строчных букв, букв русского и латинского алфавитов через применение массивов.

Файлы при обработке структурных элементов текста.
Определение файла. Операции над файлами: формирование, дополнение, считывание и запись данных, удаление. Заполнение файла заданными символами.

Задачи на динамику в алфавитно-цифровом (текстовом) режиме.
Выделение заданных символов различными цветами.
Вывод введенного слова в определенную позицию экрана через движение. «Бегущая» строка.
Способы замедления вывода символов: операторы DELAY и INKEY$, пустой цикл.
Реализация простейшего меню.
Работа с растровыми шрифтами.

Решение творческих задач и задач олимпиадного уровня.
Послоговый вывод элементов текста. Обработка чисел римской системы счисления.

Ожидаемые результаты обучения

После прохождения курса учащиеся владеют следующими знаниями, умениями и способами деятельности:
• знают классы задач на обработку текстовой информации;
• владеют приемами программирования в системах программирования и средствами табличного процессора Excel;
• знают структурные элементы текста и умеют выделять их с помощью систем программирования и табличного процессора Excel;
• знают возможности проведения динамических расчетов в табличном процессоре Excel;
• владеют разнообразными методами обработки текстовой информации и умеют выполнять операции по обработке текстовой информации на компьютере;
• умеют реализовывать решения задач в виде программ, выбирая оптимальный вариант и соответствующее программное средство;
• умеют работать с файлами данных, занося в них необходимую информацию с помощью систем программирования;
• умеют реализовывать графику в текстовом режиме;
• способны осуществлять рефлексивную деятельность, оценивать свои результаты.

Рекомендуемая литература

1. Златопольский Д. М. Работа с текстом в электронных таблицах// Информатика и образование. 2002. № 1.
2. Зубрилин А. А. Методика решения задач по теме «Символьные величины» // Информатика и образование. 2002. № 9, 10.
3. Зубрилин А. А., Ивановичева И. В. Изучаем тему «Символьные величины»//Информатика и образование. 1998. №6,7.
4. Зубрилин А. А., Овчинникова О. В. Игровые моменты при изложении темы «Символьные величины» // Информатика и образование. 2000. № 3.
5. Красковский Д. Ю. Задачи с растровыми шрифтами // Информатика и образование. 2004. № 1,2.
6. Макарова Н. В. и др. Информатика: Практикум по технологии работы на компьютере. М.: Финансы и статистика, 1998.
7. Наговицын Ю. Н. Вывод текста в графическом режиме на Бейсике // Информатика и образование. 1996. № 6.
8. Симонович С. В., Евсеев Г. А., Алексеев А. Г. Специальная информатика: Учебное пособие. М.: АСТ-Пресс, Инфорком-Пресс, 1999.
9. Шафрин Ю. А. Информационные технологии: В 2 ч. Ч. 2: Офисная технология и информационные системы. М.: Лаборатория Базовых Знаний, 2001.

Рекомендуемые электронные издания

1. Интерактивный мультимедийный обучающий курс «Практический курс Excel 2000» («Кирилл и Мефодий»).