Еще алгоритмы

Говоря в §1, что описанные там разложения позволяют, в принципе, вычислять F(x)с произвольной точностью, я умолчал о том, что точность вычислений ограничивается не только ошибкой, распространяемой при выполнении арифметических операций во время суммирования рядов и цепных дробей, но и точностью (числом верных знаков), с которой задается константа 1/Ц2p, а также ошибкой, возникающей при вычислении экспоненты. В частности, константу, возможно, придется заменить при переходе с одной платформы на другую.

Однако, раз уж «чистоту» алгоритмов соблюсти не удалось, наше падение усугубится не слишком сильно, если мы позволим себе использовать еще несколько констант. При этом мы основываемся на следующем простом рассуждении.

Скорость сходимости ряда Тейлора, являющаяся одним из главнейших показателей качества подобных алгоритмов, тем ниже, чем более удалена точка, в которой мы вычисляем функцию, от точки, в которой эта функция была разложена в ряд. Поэтому следует запасти несколько разложений в разных точках с тем, чтобы для каждой точки иметь возможность выбрать из них наилучшее. Для реализации этого соображения нужно уметь раскладывать в произвольной точке в ряд Тейлора саму F(x) или просто связанную с ней функцию. Этим мы сейчас и займемся.

Легко проверить, что F(x)удовлетворяет соотношению

(1) F^"(x) = -xF^'(x).

Разложим F(x)в ряд Тейлора в точке y:

(2) .

Положим g_n = h_nn! ; из (1)-(2) следует, что удовлетворяют следующему соотношению

(3) g_n+2 = -yg_n+1- yg_n, n і 0; g₀ = F(x), g₀ = j (y).

Обратите внимание: при y = 0 соотношения (2)-(3) задают ряд (1.1).

Еще разложение для вычисления F(x)можно получить, исходя из уравнения

(4)

.Из (4) легко получить рекурсивные соотношения для коэффициентов c_n(y) разложения Тейлора в точке y:

(5)(n+2)c_n+2 = yc_n+ 1 + c_n, n і 0; c₀ = , c₁ = 1 + c₀y.

Обратите внимание: при y = 0 соотношения задают ряд (1.3).

Легко углядеть, что с ростом y скорость сходимости обоих разложений довольно быстро падает.

Основываясь на этих разложениях, можно построить алгоритмы, которые используют возможности степенных рядов более изощренно, чем бесхитростные алгоритмы I и T.

Прежде всего, можно попросту запасти значения вычисляемой функции – F(x)или – в нескольких точках x₁,…,x_k и, выбрав для заданной точки x ближайшую из запасенных, использовать далее соответствующее разложение. На этой идее основаны алгоритмы D и P. При реализации этих алгоритмов приходится делать выбор между расходом памяти на хранение значений функции и числом суммируемых членов ряда: чем больше расстояние между соседними точками, тем меньше расход памяти, но и тем медленнее, вообще говоря, сходится ряд Тейлора. Можно также решать задачу поиска оптимального расположения запасаемых точках, но мы здесь не будем этим заниматься.

Алгоритм D. Этот алгоритм вычисляет значения функции F(x) в точках отрезка |x|Ј a. Предполагается, что отрезок [0, a] разбит на определенное число непересекающихся отрезков с центрами в x_i и известны значения F_i = F(x_i). Чтобы вычислить F(x), алгоритм выбирает x_i, для которого расстояние |x- x_i| минимально; после этого используется разложение (2)-(3) с y=x_i.

D1. Положить x1 = |x|; i = [x1/h];
         z = i*h; /* i – номер ближайшей к x точки x_i, z = x_i */
D2. /* Подготовка к вычислению ряда. */
     Положить g0 = t =F_i; g1 = exp(-z*z/2)/Ц2p;
     xn = x1 = x1-z; sum=t+g1*xn; n = 1;
D3. /* Вычисление очередной частичной суммы */
     Положить n = n+1; s=-z*g1-(n-2)*g0; g0=g1; g1 = s;
       xn=x1*xn/n;s=t; t=sum; sum = sum + g1*xn;
D4./* Проверка точности */
     Если |s-t| > e или |t-sum| > e, перейти к D3.
D5. Если x > 0 , положитьF = sum, иначе положить F = 1-sum.
     На этом работа алгоритма заканчивается. Алгоритм P. Вычисления здесь полностью аналогичны тому, что делается в алгоритме D. Используется разложение (4)-(5) и, соответственно, запасаются значения

. P1.Положить x1 = |x|.
      Положить i = [x1/h]; z = i*h
       (теперь i – номер ближайшей к x точки x_i, z = x_i).
P2./* Подготовка к вычислению ряда. */
    Положить c0 = s = R_i; c1 = 1+z*c0;
     xn = x1 = x1-z; rz=s+c1*xn; n = 1.
P3./* Вычисление очередной частичной суммы */
Положить n = n+1; xn = x1*xn; s = (c0+z*c1)/n;
c0 = c1; c1 = s; s = t; t = rz; rz = t+c1*xn.
P4./* Проверка точности */
    Если |s-t| > eили |t-rz| >e, перейти кP3.
P5.Положить 0.5 + sign(x)*rz*exp(-x*x/2)/Ц2p ;
     на этом работа алгоритма заканчивается. Можно действовать и более изысканно, подбираясь к нужной точке шажками определенной длины и вычисляя значения функции в промежуточных точках. На этом основаны алгоритмы F и C, в которых используется лишь тот факт, что F(0)=0.5, а

=0.

Алгоритм F. Последовательно вычисляются F(h), F(2h)и т.д. до тех пор, пока kґh Ј x и только после этого вычисляется F(x). Действия алгоритма напоминают движения гусеницы, которая переползает из нуля в h, из h в 2h и т.д. до тех пор, пока не доползет до точки x.

F1.Положить x1 = |x|; z = fz = 0.
F2./* Проверка окончания */
    Положить a=x1-z.
    Если a Ј0, положитьF= 0.5 + sign(x)*fz.
    На этом работа алгоритма заканчивается.
F3./* Установ шага */ Если a > h, положить a = h.
F4./* Подготовка к вычислению ряда. */
    Положить xn = a; g0 = g1 = exp(-z*z/2)/Ц2p;
      t = sum = g1*xn; n = 1.
F5./* Вычисление очередной частичной суммы ряда */
    Положить n=n+1; xn = xn*a/n; s = -z*g1-(n-2)*g0;
      g0 = g1; g1 = s; s = t; t = sum; sum = sum+g1*xn.
F6./* Проверка точности */
    Если |s-t| >> eили |t-sum| >e, перейти кF5.
F7./* В т. z разложение посчитано. Пошли в след. точку */
    Положить fz = fz + sum; z = z + a; перейти кF2. Алгоритм C. Этот алгоритм, основанный на разложении (4)-(5), полностью аналогичен предыдущему. Значение булевской переменной gotta становится равным true, когда нужная точка x достигнута. C1.Положить x1 = |x|; z = Rz = 0; gotta = false.
C2.Положить xa = z; Ra = Rz; z = z + h.
     Если zіx1, положить z = x1; gotta = true.
C3./* Подготовка к вычислению ряда. */
    Положить c0 = t = Ra; c1 = 1 + xa*Ra;
      xn = D = z- xa; Rz = Ra + c1*xn; n = 1.
C4./* Вычисление очередной частичной суммы ряда */
    Положить n=n+1; xn = D*xn; s = (c0 + xa*c1)/n;
      C0 = c1; c1 = s; s = t; t = Rz; Rz = t + c1*xn.
C5./* Проверка точности */
    Если |s-t| >eили |t-Rz| >e, перейти кC4.
C6./* Проверка окончания */
    Если gotta = false, перейти кC2.
C7.ПоложитьF= 0.5 + sign(x)*exp(-z*z/2)/Ц2p;
     на этом работа алгоритма заканчивается. Можно также двигаться из x в нуль. При этом, однако, удается использовать только разложение (2)-(3). Соответствующий алгоритм B очень близок к алгоритму 123 [8], в котором для вычисления функции ошибок

использовано разложение

(6) ,

где w_n = v_n/n!, а v_n удовлетворяют соотношениям

(7) v_n+2 = 2yv_n+1-2nv_n, n і 0; v₀ = erf(x), v₁ = .

Вычисление erf(x) при x > 0 производится по формуле

erf(x) = -s_a(x₀) - s_a(x₁) - … - s_a(x_k), в которой

, x₀ = x, x_i=x_i-1-a, iі 1, причем

, а k – наименьшее целое, такое, что x_k-1>D.

Алгоритм B. В этом алгоритме гусеница ползет из x в нуль с шагом а (предполагаем, следовательно, что а > 0).

B1.Положить x1 = |x|; Fz = 0.
B2./* Проверка окончания */
    Если x1Ј0, положитьF= 0.5 + sign(x)*Fz.
    На этом работа алгоритма заканчивается.
B3./* Установ шага */ Если x1Јa, положить a = -x1.
B4./* Подготовка к вычислению Fz */     Положить g0 = g1 = exp(-x1*x1/2)/Ц2p;
      xn = -a; n = 1; t = sum = g1*xn.
B5./* Вычисление очередной частичной суммы */     Положить n = n + 1; xn = -a*xn/n;
      s = -x1*g1-(n-2)*g0; g0 = g1; g1 = s;
      s = t; t = sum; sum = t+g1*xn.
B6./* Проверка точности */     Если |s-t| >eили |t-sum| >e, перейти кB5.
B7./* Передвижение */     Положить Fz = Fz + sum; x1 = x1 - a; перейти кB2. В алгоритме 123 выбрано D=0.5. В качестве условия останова фигурирует требование, чтобы очередной прибавляемый член не превосходил по абсолютной величине 10^-10. Основным недостатком алгоритма является возможность преждевременного выхода из цикла, вычисляющего s_a(x). В самом деле, коэффициенты ряда (6) пропорциональны полиномам Эрмита

. Поэтому в точках y, являющихся корнями какого-либо полинома, стандартное условие останова, которое здесь имеет вид |w_n(y)(x-y)ⁿ| Јe , приводит к неверному результату; этот факт отмечен в замечании к алгоритму [7]. Условием останова, предохраняющим от преждевременного обрыва ряда Тейлора, может быть: |s_n-s_n-1|Јe & |s_n+1-s_n|Јe . Эти соображения учтены в алгоритме B.

Алгоритм E. В этом представлении алгоритма 123 [8] условие останова модифицировано указанным выше способом. Кроме того, я заменил несколько операторов алгоритма 123 так, что s_a(z) вычисляется чуть более экономно. Наконец, при вычислении F(x), используется формула F(x)= (1+erf(x/Ц2))/2. Для облегчения сравнений использованы те же идентификаторы, что и в исходном алгоритме.

E1. Положить x1 = |x|/Ц2; z = 0.
E2./* Проверка окончания */     Если x1Ј0, положитьF= 0.5 + sign(x)*z;
    на этом работа алгоритма заканчивается.
E3./* Установ шага */ Если x1Јa положить a = x1.
E4./* Подготовка к вычислениюs_a(x1)*/
    Положить n = 1; u = v = exp(-x1*x1)/Цp;
      xn = a; s = 0; y = v*a.
E5./* Вычисление очередной частичной суммыs_a(x1)*/
    Положить n = n+1; w = -2*(x1*v + u(*n-2));
    u = v; v = w; xn = -a*xn/n; w = s; s = y; y = y + v*xn.
E6./* Проверка точности */     Если |w - s| >eили |s - y| >e, перейти кE5.
E7.Положить z = z + y; x1 = x1 - a и перейти кE2. Для проведения численных экспериментов алгоритмы D, P, C, B и E были реализованы на Си. В нижеследующей таблице для каждого алгоритма приводится количество "витков" цикла, потребовавшихся для вычисления значения с e = 0 для нескольких x; поскольку все алгоритмы дали одинаковые 8 знаков после запятой, сами вычисленные значения опущены.

x	D	P	C	B	E
0.25	14	16	16	16	16
0.50	20	23	20	21	21
0.75	15	18	37	36	34
1.00	1	2	42	42	40
1.25	15	17	59	57	45
1.50	19	25	65	62	60
1.75	15	19	83	78	64
2.00	1	2	88	83	70
2.25	15	18	106	99	85
2.50	19	27	112	104	89
2.75	15	20	131	120	94
3.00	1	2	137	125	111
3.25	15	20	157	141	115
3.50	18	29	163	147	121
3.75	14	21	183	163	135
4.00	1	2	190	168	140
4.25	14	21	211	185	155
4.50	17	32	218	190	161
4.75	13	23	239	206	168
5.00	1	2	246	212	182
5.25	13	22	268	229	190
5.50	15	33	275	235	195
5.75	12	24	297	253	212
6.00	1	2	305	258	218
6.25	12	23	328	277	224
6.50	15	36	336	282	241
6.75	10	25	359	302	247
7.00	1	2	367	307	251
7.25	10	24	391	327	270
7.50	11	38	399	332	275
7.75	6	26	423	353	283

Сравнение результатов работы всех этих алгоритмов позволяет констатировать здесь полное торжество грубой силы над красотой и изяществом; здесь даже не нужно учитывать количество операций внутри цикла – все ясно и без этого. Из алгоритмов P и D лучшим оказался алгоритм D. Если для него понадобятся константы F_i, я рекомендую вычислять их с помощью смеси алгоритмов T и L из §1 с использованием длинной арифметики.

Примечание. Приводимые коды алгоритмов из разделов 1 и 3 предназначены лишь для численных экспериментов, их следует рассматривать лишь как иллюстрации. "Рабочие" коды должны учитывать множество тонких моментов, среди которых особенно подчеркну продуманную систему обработки исключительных состояний. (Подобная система разрабатывается, как правило, сразу для библиотеки функций.) Приведу лишь один из сонма возможных примеров мелких хитростей, оказывающих решающее влияние на эффективность программы: в кодах, реализующих алгоритмы P и D, при вычислении i на самом первом шаге не достаточно отбросить дробную часть – необходимо честно вычислить целую часть дроби (это отражено в приведенных кодах).