Бьерн Страуструп. Язык программирования С++



бет22/124
Дата16.07.2016
өлшемі3.27 Mb.
#204081
түріКнига
1   ...   18   19   20   21   22   23   24   25   ...   124

3.1.3 Таблица имен


Есть функция поиска в таблице имен:


name* look(char* p, int ins =0);
Второй ее параметр показывает, была ли символьная строка, обозначающая

имя, ранее занесена в таблицу. Инициализатор =0 задает стандартное

значение параметра, которое используется, если функция look()

вызывается только с одним параметром. Это удобно, так как

можно писать look("sqrt2"), что означает look("sqrt2",0),

т.е. поиск, а не занесение в таблицу. Чтобы было так же удобно задавать

операцию занесения в таблицу, определяется вторая функция:
inline name* insert(const char* s) { return look(s,1); }
Как ранее упоминалось, записи в этой таблице имеют такой тип:
struct name {

char* string;

name* next;

double value;

};
Член next используется для связи записей в таблице.

Собственно таблица - это просто массив указателей на объекты типа name:


const TBLSZ = 23;

name* table[TBLSZ];


Поскольку по умолчанию все статические объекты инициализируются нулем,

такое тривиальное описание таблицы table обеспечивает также и нужную

инициализацию.

Для поиска имени в таблице функция look() использует простой

хэш-код (записи, в которых имена имеют одинаковый хэш-код,

связываются):

вместе):

int ii = 0; // хэш-код

const char* pp = p;

while (*pp) ii = ii<<1 ^ *pp++;

if (ii < 0) ii = -ii;

ii %= TBLSZ;


Иными словами, с помощью операции ^ ("исключающее ИЛИ") все символы

входной строки p поочередно добавляются к ii. Разряд в результате x^y

равен 1 тогда и только тогда, когда эти разряды в операндах x и y различны.

До выполнения операции ^ значение ii сдвигается на один разряд влево,

чтобы использовался не только один байт ii. Эти действия можно

записать таким образом:


ii <<= 1;

ii ^= *pp++;


Для хорошего хэш-кода лучше использовать операцию ^, чем +. Операция

сдвига важна для получения приемлемого хэш-кода в обоих случаях.

Операторы
if (ii < 0) ii = -ii;

ii %= TBLSZ;


гарантируют, что значение ii будет из диапазона 0...TBLSZ-1. Напомним,

что % - это операция взятия остатка. Ниже полностью приведена

функция look:
#include
name* look(const char* p, int ins =0)

{

int ii = 0; // хэш-код



const char* pp = p;

while (*pp) ii = ii<<1 ^ *pp++;

if (ii < 0) ii = -ii;

ii %= TBLSZ;


for (name* n=table[ii]; n; n=n->next) // поиск

if (strcmp(p,n->string) == 0) return n;


if (ins == 0) error("имя не найдено");
name* nn = new name; // занесение

nn->string = new char[strlen(p)+1];

strcpy(nn->string,p);

nn->value = 1;

nn->next = table[ii];

table[ii] = nn;

return nn;

}
После вычисления хэш-кода ii идет простой поиск имени по членам

next. Имена сравниваются с помощью стандартной функции

сравнения строк strcmp(). Если имя найдено, то возвращается указатель

на содержащую его запись, а в противном случае заводится новая запись

с этим именем.

Добавление нового имени означает создание нового объекта name

в свободной памяти с помощью операции new (см. $$3.2.6), его

инициализацию и включение в список имен. Последнее выполняется как

занесение нового имени в начало списка, поскольку это можно сделать даже

без проверки того, есть ли список вообще. Символьная строка имени

также размещается в свободной памяти. Функция strlen() указывает,

сколько памяти нужно для строки, операция new отводит нужную память,

а функция strcpy() копирует в нее строку. Все строковые функции

описаны в :
extern int strlen(const char*);

extern int strcmp(const char*, const char*);

extern char* strcpy(char*, const char*);

3.1.4 Обработка ошибок


Поскольку программа достаточно проста, не надо особо беспокоиться

об обработке ошибок. Функция error просто подсчитывает число ошибок,

выдает сообщение о них и возвращает управление обратно:


int no_of_errors;
double error(const char* s)

{

cerr << "error: " << s << "\n";



no_of_errors++;

return 1;

}
Небуферизованный выходной поток cerr обычно используется именно для

выдачи сообщений об ошибках.

Управление возвращается из error() потому, что ошибки, как правило,

встречаются посреди вычисления выражения. Значит надо либо полностью

прекращать вычисления, либо возвращать значение, которое не должно

вызвать последующих ошибок. Для простого калькулятора больше подходит

последнее. Если бы функция get_token() отслеживала номера строк, то

функция error() могла бы указывать пользователю приблизительное место

ошибки. Это было бы полезно при неинтерактивной работе с калькулятором.

Часто после появления ошибки программа должна завершиться, поскольку

не удалось предложить разумный вариант ее дальнейшего выполнения.

Завершить ее можно с помощью вызова функции exit(), которая заканчивает

работу с выходными потоками ($$10.5.1) и завершает программу,

возвращая свой параметр в качестве ее результата.

Более радикальный способ завершения программы - это вызов функции abort(),

которая прерывает выполнение программы немедленно или сразу же после

сохранения информации для отладчика (сброс оперативной памяти).

Подробности вы можете найти в своем справочном руководстве.

Более тонкие приемы обработки ошибок можно предложить, если

ориентироваться на особые ситуации (см.$$9), но предложенное решение

вполне приемлемо для игрушечного калькулятора в 200 строк.

3.1.5 Драйвер


Когда все части программы определены, нужен только драйвер, чтобы

инициализировать и запустить процесс. В нашем примере с этим

справится функция main():


int main()

{

// вставить предопределенные имена:



insert("pi")->value = 3.1415926535897932385;

insert("e")->value = 2.7182818284590452354;


while (cin) {

get_token();

if (curr_tok == END) break;

if (curr_tok == PRINT) continue;

cout << expr() << '\n';

}

return no_of_errors;



}
Принято, что функция main() возвращает нуль, если программа завершается

нормально, и ненулевое значение, если происходит иначе. Ненулевое

значение возвращается как число ошибок. Оказывается, вся инициализация

сводится к занесению предопределенных имен в таблицу.

В цикле main читаются выражения и выдаются результаты. Это делает

одна строка:


cout << expr() << '\n';
Проверка cin при каждом проходе цикла гарантирует завершение программы,

даже если что-то случится с входным потоком, а проверка на лексему

END нужна для нормального завершения цикла, когда функция get_token()

обнаружит конец файла. Оператор break служит для выхода из

ближайшего объемлющего оператора switch или цикла (т.е. оператора for,

while или do). Проверка на лексему PRINT (т.е. на '\n' и ';') снимает

с функции expr() обязанность обрабатывать пустые выражения. Оператор

continue эквивалентен переходу на конец цикла, поэтому в нашем

случае фрагмент:
while (cin) {

// ...


if (curr_tok == PRINT) continue;

cout << expr() << "\n";

}
эквивалентен фрагменту:
while (cin) {

// ...


if (curr_tok == PRINT) goto end_of_loop;

cout << expr() << "\n";

end_of_loop: ;

}
Более подробно циклы описываются в $$R.6





Достарыңызбен бөлісу:
1   ...   18   19   20   21   22   23   24   25   ...   124




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет