diff --git a/ml_system_design/seminars/imgs/sem1/sem1_1.png b/ml_system_design/seminars/imgs/sem1/sem1_1.png new file mode 100644 index 0000000..e4c7833 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_1.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_10.png b/ml_system_design/seminars/imgs/sem1/sem1_10.png new file mode 100644 index 0000000..d831bf6 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_10.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_11.png b/ml_system_design/seminars/imgs/sem1/sem1_11.png new file mode 100644 index 0000000..c79c452 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_11.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_12.png b/ml_system_design/seminars/imgs/sem1/sem1_12.png new file mode 100644 index 0000000..3a95e97 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_12.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_13.png b/ml_system_design/seminars/imgs/sem1/sem1_13.png new file mode 100644 index 0000000..9c990b4 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_13.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_14.png b/ml_system_design/seminars/imgs/sem1/sem1_14.png new file mode 100644 index 0000000..a103d56 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_14.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_2.png b/ml_system_design/seminars/imgs/sem1/sem1_2.png new file mode 100644 index 0000000..4de7b31 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_2.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_3.png b/ml_system_design/seminars/imgs/sem1/sem1_3.png new file mode 100644 index 0000000..105df10 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_3.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_4.png b/ml_system_design/seminars/imgs/sem1/sem1_4.png new file mode 100644 index 0000000..363d512 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_4.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_5.png b/ml_system_design/seminars/imgs/sem1/sem1_5.png new file mode 100644 index 0000000..9c14a28 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_5.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_6.png b/ml_system_design/seminars/imgs/sem1/sem1_6.png new file mode 100644 index 0000000..5ab6d37 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_6.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_7.png b/ml_system_design/seminars/imgs/sem1/sem1_7.png new file mode 100644 index 0000000..867329a Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_7.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_8.png b/ml_system_design/seminars/imgs/sem1/sem1_8.png new file mode 100644 index 0000000..97aecf0 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_8.png differ diff --git a/ml_system_design/seminars/imgs/sem1/sem1_9.png b/ml_system_design/seminars/imgs/sem1/sem1_9.png new file mode 100644 index 0000000..da0abd6 Binary files /dev/null and b/ml_system_design/seminars/imgs/sem1/sem1_9.png differ diff --git a/ml_system_design/seminars/imgs/sem4/bagging.png b/ml_system_design/seminars/imgs/sem4/bagging.png new file mode 100644 index 0000000..3622eef Binary files /dev/null and b/ml_system_design/seminars/imgs/sem4/bagging.png differ diff --git a/ml_system_design/seminars/imgs/sem4/bootstrap.jpg b/ml_system_design/seminars/imgs/sem4/bootstrap.jpg new file mode 100644 index 0000000..93c701a Binary files /dev/null and b/ml_system_design/seminars/imgs/sem4/bootstrap.jpg differ diff --git a/ml_system_design/seminars/sem1.ipynb b/ml_system_design/seminars/sem1.ipynb new file mode 100644 index 0000000..e0cb0e5 --- /dev/null +++ b/ml_system_design/seminars/sem1.ipynb @@ -0,0 +1,3249 @@ +{ + "cells": [ + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "# Семинар №1\n", + "# Введение в линейную алгебру. Векторы. Матрицы и операции с ними. Библиотека NumPy" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Векторы" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "**Определение** : *Вектором* в n-мерном евклидовом пространстве $\\R^{n}$ называется упорядоченый набор чисел $x = (x_1, x_2, ..., x_n)$ - собственно, элемент пространства $\\R^{n}$.\n", + "\n", + "Часто вектор удобнее записывать в столбец: \n", + "$$x = \\begin{pmatrix}x_1\\\\x_2\\\\...\\\\x_n\\\\\\end{pmatrix}$$" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Помимо того, что вектор это набор чисел, вектор еще и геометрический объект, мы его можем отобразить на координатной поскости и в пространстве:\n", + "\n", + "![](imgs/sem1/sem1_1.png) | ![](imgs/sem1/sem1_2.png)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Операции над векторами" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Векторы можно складывать и умножать на скаляр(число). Результатом будет вектор, элементами которого являются результаты поэлементного выполнения операции." + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "#### Сложение векторов\n", + "\n", + "Геометрически сложение векторов выглядит так:\n", + "\n", + "| для неколлинеарных векторов | для коллинеарных векторов | сложение нескольких векторов |\n", + "| --- | --- | --- |\n", + "| ![](imgs/sem1/sem1_3.png) | ![](imgs/sem1/sem1_4.png) | ![](imgs/sem1/sem1_5.png) |\n", + "\n", + "**Пример**\n", + "\n", + "![](imgs/sem1/sem1_6.png)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "#### Линейные подпространства\n", + "\n", + "- Векторное пространство $\\R^{n}$ **замкнуто** относительно операций сложения и умножения на скаляр.\n", + "\n", + "**Определение**: *Линейным (или векторным) подпространством* векторного пространства $L$ называется множество векторов $M$ $\\subset$ $L$, замкнутое относительно операций сложения и умножения на скаляр.\n", + "\n", + "**Определение**: *Линейной оболочкой векторов $v_1, v_2, ..., v_n$* называется множество всех линейных комбинаций этих векторов с произвольными коэффициентами: $$M = = \\{\\alpha_{1}v_{1} + \\alpha_{2}v_{2} + ... + \\alpha_{n}v_{n} \\ \\ | \\ \\ \\alpha_{i}\\in \\R\\}$$\n", + "\n", + "#### ЛНЗ\n", + "**Определение**: Векторы $v_1, v_2, ..., v_n$ называются *линейно независимыми*, если никакая линейная комбинация этих векторов не равна нуль-вектору. Иными словами, для любых $\\alpha_{i} \\in \\R$, не все из которых нулевые, выполняется $$\\alpha_{1}v_{1} + \\alpha_{2}v_{2} + ... + \\alpha_{n}v_{n} \\ne \\overline{0}$$\n", + "\n", + "![](imgs/sem1/sem1_7.png)\n", + "\n", + "#### Базис\n", + "**Определение**: Пусть $M$ - линейное подпространство. Базисом в $M$ называется минимальная система векторов $v_1, v_2, ..., v_n$, для которой $M = $\n", + "\n", + "![](imgs/sem1/sem1_8.png)\n", + "\n", + "Свойства базиса:\n", + "\n", + "- Базис является ЛНЗ\n", + "- Векторы из $M$ выражаются через базис единственным способом\n", + "- Любую ЛНЗ систему можно дополнить до базиса\n", + "- В любой системе образующих можно выбрать базис\n", + "- Любые два базиса равномощны. (Это свидетельствует о корректности определения *размерности линейного пространства* как размера базиса в этом линейном пространстве)\n", + "\n", + "\n", + "**Теорема**: $n+1$ векторов в $n-мерном$ пространстве всегда линейно зависимы.\n", + "\n", + "**Доказательство**: От противного. Пусть Они ЛНЗ => Можно дополнить до базиса => в базисе n+1 векторов и более => противоречие т.к. любые два базиса равномощны. \n", + "\n" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Далее поговорим как работать с векторами в `Python` с использованием библиотеки `NumPy`" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Отвлечемся на введение в NumPy" + ] + }, + { + "cell_type": "code", + "execution_count": 1, + "metadata": {}, + "outputs": [], + "source": [ + "# !conda install numpy\n", + "# !pip3 install numpy" + ] + }, + { + "cell_type": "code", + "execution_count": 2, + "metadata": {}, + "outputs": [], + "source": [ + "import numpy as np" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Одномерные массивы" + ] + }, + { + "cell_type": "code", + "execution_count": 3, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + " \n" + ] + } + ], + "source": [ + "a = [1, 2, 3]\n", + "b = np.array(a, dtype='float64')\n", + "print(type(b), type(a))" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Если типы разные, то идет неявный каст к одному.***" + ] + }, + { + "cell_type": "code", + "execution_count": 4, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Для list: \n", + "Для np.array: \n" + ] + } + ], + "source": [ + "a = [1, 2, 'a']\n", + "b = np.array(a)\n", + "print(\"Для list:\", type(a[0]),\n", + " \"\\nДля np.array:\", type(b[0]))" + ] + }, + { + "cell_type": "code", + "execution_count": 5, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([1, 2, 3])" + ] + }, + "execution_count": 5, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "d = np.array([1, 2, 3])\n", + "d" + ] + }, + { + "cell_type": "code", + "execution_count": 6, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "numpy.ndarray" + ] + }, + "execution_count": 6, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "type(d)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Можем посмотреть на все методы класса ``ndarray``.***" + ] + }, + { + "cell_type": "code", + "execution_count": 7, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "{'T',\n", + " '__abs__',\n", + " '__add__',\n", + " '__and__',\n", + " '__array__',\n", + " '__array_finalize__',\n", + " '__array_function__',\n", + " '__array_interface__',\n", + " '__array_prepare__',\n", + " '__array_priority__',\n", + " '__array_struct__',\n", + " '__array_ufunc__',\n", + " '__array_wrap__',\n", + " '__bool__',\n", + " '__class_getitem__',\n", + " '__complex__',\n", + " '__contains__',\n", + " '__copy__',\n", + " '__deepcopy__',\n", + " '__delitem__',\n", + " '__divmod__',\n", + " '__dlpack__',\n", + " '__dlpack_device__',\n", + " '__float__',\n", + " '__floordiv__',\n", + " '__getitem__',\n", + " '__iadd__',\n", + " '__iand__',\n", + " '__ifloordiv__',\n", + " '__ilshift__',\n", + " '__imatmul__',\n", + " '__imod__',\n", + " '__imul__',\n", + " '__index__',\n", + " '__int__',\n", + " '__invert__',\n", + " '__ior__',\n", + " '__ipow__',\n", + " '__irshift__',\n", + " '__isub__',\n", + " '__iter__',\n", + " '__itruediv__',\n", + " '__ixor__',\n", + " '__len__',\n", + " '__lshift__',\n", + " '__matmul__',\n", + " '__mod__',\n", + " '__mul__',\n", + " '__neg__',\n", + " '__or__',\n", + " '__pos__',\n", + " '__pow__',\n", + " '__radd__',\n", + " '__rand__',\n", + " '__rdivmod__',\n", + " '__rfloordiv__',\n", + " '__rlshift__',\n", + " '__rmatmul__',\n", + " '__rmod__',\n", + " '__rmul__',\n", + " '__ror__',\n", + " '__rpow__',\n", + " '__rrshift__',\n", + " '__rshift__',\n", + " '__rsub__',\n", + " '__rtruediv__',\n", + " '__rxor__',\n", + " '__setitem__',\n", + " '__setstate__',\n", + " '__sub__',\n", + " '__truediv__',\n", + " '__xor__',\n", + " 'all',\n", + " 'any',\n", + " 'argmax',\n", + " 'argmin',\n", + " 'argpartition',\n", + " 'argsort',\n", + " 'astype',\n", + " 'base',\n", + " 'byteswap',\n", + " 'choose',\n", + " 'clip',\n", + " 'compress',\n", + " 'conj',\n", + " 'conjugate',\n", + " 'copy',\n", + " 'ctypes',\n", + " 'cumprod',\n", + " 'cumsum',\n", + " 'data',\n", + " 'diagonal',\n", + " 'dot',\n", + " 'dtype',\n", + " 'dump',\n", + " 'dumps',\n", + " 'fill',\n", + " 'flags',\n", + " 'flat',\n", + " 'flatten',\n", + " 'getfield',\n", + " 'imag',\n", + " 'item',\n", + " 'itemset',\n", + " 'itemsize',\n", + " 'max',\n", + " 'mean',\n", + " 'min',\n", + " 'nbytes',\n", + " 'ndim',\n", + " 'newbyteorder',\n", + " 'nonzero',\n", + " 'partition',\n", + " 'prod',\n", + " 'ptp',\n", + " 'put',\n", + " 'ravel',\n", + " 'real',\n", + " 'repeat',\n", + " 'reshape',\n", + " 'resize',\n", + " 'round',\n", + " 'searchsorted',\n", + " 'setfield',\n", + " 'setflags',\n", + " 'shape',\n", + " 'size',\n", + " 'sort',\n", + " 'squeeze',\n", + " 'std',\n", + " 'strides',\n", + " 'sum',\n", + " 'swapaxes',\n", + " 'take',\n", + " 'tobytes',\n", + " 'tofile',\n", + " 'tolist',\n", + " 'tostring',\n", + " 'trace',\n", + " 'transpose',\n", + " 'var',\n", + " 'view'}" + ] + }, + "execution_count": 7, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "set(dir(b)) - set(dir(object))" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Например узнаем размер массива.***" + ] + }, + { + "cell_type": "code", + "execution_count": 8, + "metadata": {}, + "outputs": [], + "source": [ + "arr = np.array([5, 6, 2, 1, 10], dtype='int32')" + ] + }, + { + "cell_type": "code", + "execution_count": 9, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "20" + ] + }, + "execution_count": 9, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "arr.nbytes" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Если вы не знаете нужной функции, но понимаете, чего хотите, тогда можно воспользоваться поиском в документации.***" + ] + }, + { + "cell_type": "code", + "execution_count": 10, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Search results for 'mean value of array'\n", + "----------------------------------------\n", + "numpy.ma.mean\n", + " Returns the average of the array elements along given axis.\n", + "numpy.mean\n", + " Compute the arithmetic mean along the specified axis.\n", + "numpy.nanmean\n", + " Compute the arithmetic mean along the specified axis, ignoring NaNs.\n", + "numpy.put\n", + " Replaces specified elements of an array with given values.\n", + "numpy.full\n", + " Return a new array of given shape and type, filled with `fill_value`.\n", + "numpy.digitize\n", + " Return the indices of the bins to which each value in input array belongs.\n", + "numpy.isrealobj\n", + " Return True if x is a not complex type or an array of complex numbers.\n", + "numpy.unpackbits\n", + " Unpacks elements of a uint8 array into a binary-valued output array.\n", + "numpy.nanquantile\n", + " Compute the qth quantile of the data along the specified axis,\n", + "numpy.ma.dot\n", + " Return the dot product of two arrays.\n", + "numpy.count_nonzero\n", + " Counts the number of non-zero values in the array ``a``.\n", + "numpy.ma.fix_invalid\n", + " Return input with invalid data masked and replaced by a fill value.\n", + "numpy.matrix.partition\n", + " Rearranges the elements in the array in such a way that the value of the\n", + "numpy.ma.MaskedArray.filled\n", + " Return a copy of self, with masked values filled with a given value.\n", + "numpy.ma.MaskedArray.partition\n", + " Rearranges the elements in the array in such a way that the value of the\n", + "numpy.exp\n", + " Calculate the exponential of all elements in the input array.\n", + "numpy.ptp\n", + " Range of values (maximum - minimum) along an axis.\n", + "numpy.sum\n", + " Sum of array elements over a given axis.\n", + "numpy.var\n", + " Compute the variance along the specified axis.\n", + "numpy.copy\n", + " Return an array copy of the given object.\n", + "numpy.prod\n", + " Return the product of array elements over a given axis.\n", + "numpy.block\n", + " Assemble an nd-array from nested lists of blocks.\n", + "numpy.copyto\n", + " Copies values from one array to another, broadcasting as necessary.\n", + "numpy.median\n", + " Compute the median along the specified axis.\n", + "numpy.nanmax\n", + " Return the maximum of an array or maximum along an axis, ignoring any\n", + "numpy.nanmin\n", + " Return minimum of an array or minimum along an axis, ignoring any NaNs.\n", + "numpy.nansum\n", + " Return the sum of array elements over a given axis treating Not a\n", + "numpy.nanvar\n", + " Compute the variance along the specified axis, while ignoring NaNs.\n", + "numpy.allclose\n", + " Returns True if two arrays are element-wise equal within a tolerance.\n", + "numpy.gradient\n", + " Return the gradient of an N-dimensional array.\n", + "numpy.nanmedian\n", + " Compute the median along the specified axis, while ignoring NaNs.\n", + "numpy.ones_like\n", + " Return an array of ones with the same shape and type as a given array.\n", + "numpy.lib.recfunctions.assign_fields_by_name\n", + " Assigns values from one structured array to another by field name.\n", + "numpy.percentile\n", + " Compute the q-th percentile of the data along the specified axis.\n", + "numpy.zeros_like\n", + " Return an array of zeros with the same shape and type as a given array.\n", + "numpy.ma.exp\n", + " Calculate the exponential of all elements in the input array.\n", + "numpy.chararray.copy\n", + " Return a copy of the array.\n", + "numpy.ma.var\n", + " Compute the variance along the specified axis.\n", + "numpy.chararray.view\n", + " New view of array with the same data.\n", + "numpy.nanpercentile\n", + " Compute the qth percentile of the data along the specified axis,\n", + "numpy.chararray.astype\n", + " Copy of the array, cast to a specified type.\n", + "numpy.ma.median\n", + " Compute the median along the specified axis.\n", + "numpy.linalg.svd\n", + " Singular Value Decomposition.\n", + "numpy.ma.ones_like\n", + " Return an array of ones with the same shape and type as a given array.\n", + "numpy.ma.zeros_like\n", + " Return an array of zeros with the same shape and type as a given array.\n", + "numpy.ma.MaskedArray.mean\n", + " Returns the average of the array elements along given axis.\n", + "numpy.ma.MaskedArray.dot\n", + " Masked dot product of two arrays. Note that `out` and `strict` are\n", + "numpy.ma.MaskedArray.var\n", + " Compute the variance along the specified axis.\n", + "numpy.ma.MaskedArray.copy\n", + " Return a copy of the array.\n", + "numpy.polynomial.polyutils.trimcoef\n", + " Remove \"small\" \"trailing\" coefficients from a polynomial.\n", + "numpy.pad\n", + " Pad an array.\n", + "numpy.std\n", + " Compute the standard deviation along the specified axis.\n", + "numpy.take\n", + " Take elements from an array along an axis.\n", + "numpy.isnan\n", + " Test element-wise for NaN and return result as a boolean array.\n", + "numpy.nditer\n", + " Efficient multi-dimensional iterator object to iterate over arrays.\n", + "numpy.reshape\n", + " Gives a new shape to an array without changing its data.\n", + "numpy.quantile\n", + " Compute the q-th quantile of the data along the specified axis.\n", + "numpy.full_like\n", + " Return a full array with the same shape and type as a given array.\n", + "numpy.empty_like\n", + " Return a new array with the same shape and type as a given array.\n", + "numpy.asarray_chkfinite\n", + " Convert the input to an array, checking for NaNs or Infs.\n", + "numpy.ma.ptp\n", + " Return (maximum - minimum) along the given dimension\n", + "numpy.ma.anom\n", + " Compute the anomalies (deviations from the arithmetic mean)\n", + "numpy.fft.ifft2\n", + " Compute the 2-dimensional inverse discrete Fourier Transform.\n", + "numpy.fft.ifftn\n", + " Compute the N-dimensional inverse discrete Fourier Transform.\n", + "numpy.ma.ravel\n", + " Returns a 1D version of self, as a view.\n", + "numpy.fft.irfftn\n", + " Computes the inverse of `rfftn`.\n", + "numpy.linalg.cond\n", + " Compute the condition number of a matrix.\n", + "numpy.linalg.norm\n", + " Matrix or vector norm.\n", + "numpy.histogram_bin_edges\n", + " Function to calculate only the edges of the bins used by the `histogram`\n", + "numpy.ma.MaskedArray.ptp\n", + " Return (maximum - minimum) along the given dimension\n", + "numpy.ma.MaskedArray.anom\n", + " Compute the anomalies (deviations from the arithmetic mean)\n", + "numpy.ma.MaskedArray.ravel\n", + " Returns a 1D version of self, as a view.\n", + "numpy.random.Generator.wald\n", + " Draw samples from a Wald, or inverse Gaussian, distribution.\n", + "numpy.polynomial.Hermite._fit\n", + " Least squares fit of Hermite series to data.\n", + "numpy.random.Generator.choice\n", + " Generates a random sample from a given array\n", + "numpy.random.RandomState.wald\n", + " Draw samples from a Wald, or inverse Gaussian, distribution.\n", + "numpy.polynomial.HermiteE._fit\n", + " Least squares fit of Hermite series to data.\n", + "numpy.polynomial.Laguerre._fit\n", + " Least squares fit of Laguerre series to data.\n", + "numpy.polynomial.Legendre._fit\n", + " Least squares fit of Legendre series to data.\n", + "numpy.polynomial.Chebyshev._fit\n", + " Least squares fit of Chebyshev series to data.\n", + "numpy.random.RandomState.choice\n", + " Generates a random sample from a given 1-D array\n", + "numpy.polynomial.Polynomial._fit\n", + " Least-squares fit of a polynomial to data.\n", + "numpy.random.Generator.lognormal\n", + " Draw samples from a log-normal distribution.\n", + "numpy.random.RandomState.lognormal\n", + " Draw samples from a log-normal distribution.\n", + "numpy.random.Generator.standard_normal\n", + " Draw samples from a standard Normal distribution (mean=0, stdev=1).\n", + "numpy.einsum\n", + " einsum(subscripts, *operands, out=None, dtype=None, order='K',\n", + "numpy.interp\n", + " One-dimensional linear interpolation for monotonically increasing sample points.\n", + "numpy.kaiser\n", + " Return the Kaiser window.\n", + "numpy.nanstd\n", + " Compute the standard deviation along the specified axis, while\n", + "numpy.average\n", + " Compute the weighted average along the specified axis.\n", + "numpy.hamming\n", + " Return the Hamming window.\n", + "numpy.hanning\n", + " Return the Hanning window.\n", + "numpy.loadtxt\n", + " Load data from a text file.\n", + "numpy.polyfit\n", + " Least squares polynomial fit.\n", + "numpy.bartlett\n", + " Return the Bartlett window.\n", + "numpy.blackman\n", + " Return the Blackman window.\n", + "numpy.can_cast\n", + " Returns True if cast between data types can occur according to the\n", + "numpy.random.RandomState.standard_normal\n", + " Draw samples from a standard Normal distribution (mean=0, stdev=1).\n", + "numpy.isfinite\n", + " Test element-wise for finiteness (not infinity and not Not a Number).\n", + "numpy.random.Generator.multivariate_normal\n", + " multivariate_normal(mean, cov, size=None, check_valid='warn',\n", + "numpy.nan_to_num\n", + " Replace NaN with zero and infinity with large finite numbers (default\n", + "numpy.random.RandomState.multivariate_normal\n", + " Draw random samples from a multivariate normal distribution.\n", + "numpy.fft.fft2\n", + " Compute the 2-dimensional discrete Fourier Transform.\n", + "numpy.fft.fftn\n", + " Compute the N-dimensional discrete Fourier Transform.\n", + "numpy.ma.copy\n", + " a.copy(order='C')\n", + "numpy.fft.rfft\n", + " Compute the one-dimensional discrete Fourier Transform for real input.\n", + "numpy.fft.rfftn\n", + " Compute the N-dimensional discrete Fourier Transform for real input.\n", + "numpy.ma.polyfit\n", + " Least squares polynomial fit.\n", + "numpy.random.SFC64\n", + " BitGenerator for Chris Doty-Humphrey's Small Fast Chaotic PRNG.\n", + "numpy.ma.empty_like\n", + " empty_like(prototype, dtype=None, order='K', subok=True, shape=None)\n", + "numpy.random.Generator.f\n", + " Draw samples from an F distribution.\n", + "numpy.random.RandomState.f\n", + " Draw samples from an F distribution.\n", + "numpy.random.Generator.gamma\n", + " Draw samples from a Gamma distribution.\n", + "numpy.random.Generator.gumbel\n", + " Draw samples from a Gumbel distribution.\n", + "numpy.random.Generator.normal\n", + " Draw random samples from a normal (Gaussian) distribution.\n", + "numpy.random.Generator.laplace\n", + " Draw samples from the Laplace or double exponential distribution with\n", + "numpy.random.RandomState.gamma\n", + " Draw samples from a Gamma distribution.\n", + "numpy.random.Generator.logistic\n", + " Draw samples from a logistic distribution.\n", + "numpy.random.Generator.rayleigh\n", + " Draw samples from a Rayleigh distribution.\n", + "numpy.random.Generator.vonmises\n", + " Draw samples from a von Mises distribution.\n", + "numpy.random.RandomState.gumbel\n", + " Draw samples from a Gumbel distribution.\n", + "numpy.random.RandomState.normal\n", + " Draw random samples from a normal (Gaussian) distribution.\n", + "numpy.random.Generator.chisquare\n", + " Draw samples from a chi-square distribution.\n", + "numpy.random.RandomState.laplace\n", + " Draw samples from the Laplace or double exponential distribution with\n", + "numpy.random.Generator.standard_t\n", + " Draw samples from a standard Student's t distribution with `df` degrees\n", + "numpy.random.RandomState.logistic\n", + " Draw samples from a logistic distribution.\n", + "numpy.random.RandomState.rayleigh\n", + " Draw samples from a Rayleigh distribution.\n", + "numpy.random.RandomState.vonmises\n", + " Draw samples from a von Mises distribution.\n", + "numpy.random.RandomState.chisquare\n", + " Draw samples from a chi-square distribution.\n", + "numpy.random.Generator.noncentral_f\n", + " Draw samples from the noncentral F distribution.\n", + "numpy.random.RandomState.standard_t\n", + " Draw samples from a standard Student's t distribution with `df` degrees\n", + "numpy.random.Generator.standard_gamma\n", + " Draw samples from a standard Gamma distribution.\n", + "numpy.random.RandomState.noncentral_f\n", + " Draw samples from the noncentral F distribution.\n", + "numpy.random.RandomState.standard_gamma\n", + " Draw samples from a standard Gamma distribution.\n", + "numpy.random.Generator.negative_binomial\n", + " Draw samples from a negative binomial distribution." + ] + } + ], + "source": [ + "np.lookfor('mean value of array') " + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Далее можно почитать документацию про контретную функцию.***" + ] + }, + { + "cell_type": "code", + "execution_count": 11, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "\u001b[0;31mSignature:\u001b[0m \u001b[0mnp\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mma\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mmean\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0ma\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m*\u001b[0m\u001b[0margs\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m**\u001b[0m\u001b[0mparams\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", + "\u001b[0;31mType:\u001b[0m _frommethod\n", + "\u001b[0;31mString form:\u001b[0m \n", + "\u001b[0;31mFile:\u001b[0m ~/miniconda3/envs/py38/lib/python3.8/site-packages/numpy/ma/core.py\n", + "\u001b[0;31mDocstring:\u001b[0m \n", + "mean(self, axis=None, dtype=None, out=None, keepdims=)\n", + "\n", + "Returns the average of the array elements along given axis.\n", + "\n", + "Masked entries are ignored, and result elements which are not\n", + "finite will be masked.\n", + "\n", + "Refer to `numpy.mean` for full documentation.\n", + "\n", + "See Also\n", + "--------\n", + "numpy.ndarray.mean : corresponding function for ndarrays\n", + "numpy.mean : Equivalent function\n", + "numpy.ma.average : Weighted average.\n", + "\n", + "Examples\n", + "--------\n", + ">>> a = np.ma.array([1,2,3], mask=[False, False, True])\n", + ">>> a\n", + "masked_array(data=[1, 2, --],\n", + " mask=[False, False, True],\n", + " fill_value=999999)\n", + ">>> a.mean()\n", + "1.5\n", + "\u001b[0;31mClass docstring:\u001b[0m\n", + "Define functions from existing MaskedArray methods.\n", + "\n", + "Parameters\n", + "----------\n", + "methodname : str\n", + " Name of the method to transform." + ] + } + ], + "source": [ + "?np.ma.mean" + ] + }, + { + "cell_type": "code", + "execution_count": 12, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "np.concatenate\n", + "np.conj\n", + "np.conjugate\n", + "np.convolve" + ] + } + ], + "source": [ + "np.con*?" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Посмотрим на количественные характеристики ``ndarray``.***" + ] + }, + { + "cell_type": "code", + "execution_count": 13, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[[1 2 3 4]\n", + " [2 3 4 3]\n", + " [1 1 1 1]]\n", + "\n", + " [[1 2 3 4]\n", + " [2 3 4 3]\n", + " [1 1 1 1]]]\n" + ] + } + ], + "source": [ + "arr = np.array([[[1, 2, 3, 4],\n", + " [2, 3, 4, 3],\n", + " [1, 1, 1, 1]], \n", + " [[1, 2, 3, 4],\n", + " [2, 3, 4, 3],\n", + " [1, 1, 1, 1]]])\n", + "print(arr)" + ] + }, + { + "cell_type": "code", + "execution_count": 14, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "len: 2 -- количество элементов по первой оси. \n", + "size: 24 -- всего элементов в матрице. \n", + "ndim: 3 -- размерность матрицы. \n", + "shape: (2, 3, 4) -- количество элементов по каждой оси.\n" + ] + } + ], + "source": [ + "print(\"len:\", len(arr), \"-- количество элементов по первой оси.\",\n", + " \"\\nsize:\", arr.size, \"-- всего элементов в матрице.\",\n", + " \"\\nndim:\", arr.ndim, \"-- размерность матрицы.\",\n", + " \"\\nshape:\", arr.shape, \"-- количество элементов по каждой оси.\")" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Индексы.***" + ] + }, + { + "cell_type": "code", + "execution_count": 15, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "(1, 2)" + ] + }, + "execution_count": 15, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "a = np.array([1, 2, 3, 4])\n", + "a[0], a[1]" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Последний элемент.***" + ] + }, + { + "cell_type": "code", + "execution_count": 16, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "4" + ] + }, + "execution_count": 16, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "a[-1]" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Можем изменять объекты массива.***" + ] + }, + { + "cell_type": "code", + "execution_count": 17, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([ 1, 2, -1, 4])" + ] + }, + "execution_count": 17, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "a[2] = -1\n", + "a" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***``ndarray`` можно использовать в циклах. Но при этом теряется главное преимущество `Numpy` -- быстродействие. Всегда, когда это возможно, лучше использовать операции над массивами как едиными целыми.***" + ] + }, + { + "cell_type": "code", + "execution_count": 18, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "1\n", + "2\n", + "-1\n", + "4\n" + ] + } + ], + "source": [ + "for i in a:\n", + " print(i)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "**Задача 1:** Создать numpy-массив, состоящий из первых четырех простых чисел, выведите его тип и размер:" + ] + }, + { + "cell_type": "code", + "execution_count": 19, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[2 3 5 7]\n", + "int64\n", + "\n", + "(4,)\n", + "32\n" + ] + } + ], + "source": [ + "# решение\n", + "\n", + "arr = np.array([2, 3, 5, 7])\n", + "print(arr)\n", + "print(arr.dtype)\n", + "print(type(arr))\n", + "print(arr.shape)\n", + "print(arr.nbytes)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Создание массивов" + ] + }, + { + "cell_type": "code", + "execution_count": 20, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[0 0 0 0 0 0 0]\n", + "[1. 1. 1. 1. 1. 1. 1.]\n" + ] + } + ], + "source": [ + "a = np.zeros(7, dtype=np.int16) # массив из нулей\n", + "b = np.ones(7, dtype=np.float64) # массив из единиц\n", + "print(a)\n", + "print(b)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Часто нужно создать нулевой массив такой же как другой.***" + ] + }, + { + "cell_type": "code", + "execution_count": 21, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([0., 0., 0., 0., 0., 0., 0.])" + ] + }, + "execution_count": 21, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "c = np.zeros(7, dtype=np.float64)\n", + "c" + ] + }, + { + "cell_type": "code", + "execution_count": 22, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([0, 0, 0, 0, 0, 0, 0])" + ] + }, + "execution_count": 22, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "c = np.zeros_like(b, dtype=np.int64)\n", + "c" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Функция `np.arange` подобна `range`. Аргументы могут быть с плавающей точкой. Следует избегать ситуаций, когда (конец-начало)/шаг -- целое число, потому что в этом случае включение последнего элемента зависит от ошибок округления. Лучше, чтобы конец диапазона был где-то посредине шага.***" + ] + }, + { + "cell_type": "code", + "execution_count": 23, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 1 5 9 13]\n", + "[ 5. 5.2 5.4 5.6 5.8 6. 6.2 6.4 6.6 6.8 7. 7.2 7.4 7.6\n", + " 7.8 8. 8.2 8.4 8.6 8.8 9. 9.2 9.4 9.6 9.8 10. 10.2 10.4\n", + " 10.6 10.8 11. 11.2 11.4 11.6 11.8 12. 12.2 12.4 12.6 12.8 13. 13.2\n", + " 13.4 13.6 13.8 14. 14.2 14.4 14.6 14.8 15. 15.2 15.4 15.6 15.8 16.\n", + " 16.2 16.4 16.6 16.8 17. 17.2 17.4 17.6 17.8 18. 18.2 18.4 18.6 18.8\n", + " 19. 19.2 19.4 19.6 19.8 20. 20.2 20.4 20.6 20.8]\n", + "[1 2 3 4 5 6 7 8 9]\n", + "[0 1 2 3 4]\n" + ] + } + ], + "source": [ + "a = np.arange(1, 16, 4)\n", + "b = np.arange(5., 21, 0.2)\n", + "c = np.arange(1, 10)\n", + "d = np.arange(5)\n", + "print(a)\n", + "print(b)\n", + "print(c)\n", + "print(d)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Последовательности чисел с постоянным шагом можно также создавать функцией `linspace`. Начало и конец диапазона включаются; последний аргумент -- число точек.***" + ] + }, + { + "cell_type": "code", + "execution_count": 24, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 1. 1.73684211 2.47368421 3.21052632 3.94736842 4.68421053\n", + " 5.42105263 6.15789474 6.89473684 7.63157895 8.36842105 9.10526316\n", + " 9.84210526 10.57894737 11.31578947 12.05263158 12.78947368 13.52631579\n", + " 14.26315789 15. ]\n", + "[ 5. 5.77777778 6.55555556 7.33333333 8.11111111 8.88888889\n", + " 9.66666667 10.44444444 11.22222222 12. ]\n" + ] + } + ], + "source": [ + "a = np.linspace(1, 15, 20)\n", + "b = np.linspace(5, 12, 10)\n", + "print(a)\n", + "print(b)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "**Задача 2:** создать и вывести последовательность чисел от 10 до 32 с постоянным шагом, длина последовательности -- 12. Чему равен шаг?" + ] + }, + { + "cell_type": "code", + "execution_count": 25, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[10. 12. 14. 16. 18. 20. 22. 24. 26. 28. 30. 32.]\n", + "2.0\n" + ] + } + ], + "source": [ + "# решение\n", + "\n", + "a = np.linspace(10, 32, 12)\n", + "print(a)\n", + "print(a[1] - a[0])\n", + "\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Последовательность чисел с постоянным шагом по логарифмической шкале от $10^0$ до $10^3$.***" + ] + }, + { + "cell_type": "code", + "execution_count": 26, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 1. 1.87381742 3.51119173 6.57933225 12.32846739\n", + " 23.101297 43.28761281 81.11308308 151.9911083 284.80358684\n", + " 533.66992312 1000. ]\n" + ] + } + ], + "source": [ + "b = np.logspace(0, 3, 12)\n", + "print(b)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Операции над одномерными массивами." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Все арифметические операции производятся поэлементно.***" + ] + }, + { + "cell_type": "code", + "execution_count": 27, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[10. 12. 14. 16. 18. 20. 22. 24. 26. 28. 30. 32.]\n", + "[ 1. 1.87381742 3.51119173 6.57933225 12.32846739\n", + " 23.101297 43.28761281 81.11308308 151.9911083 284.80358684\n", + " 533.66992312 1000. ]\n" + ] + } + ], + "source": [ + "print(a)\n", + "print(b)" + ] + }, + { + "cell_type": "code", + "execution_count": 28, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.]\n", + "[ 5. 10. 15. 20. 25. 30. 35. 40. 45. 50. 55.]\n", + "[ -6. -24. -54. -96. -150. -216. -294. -384. -486. -600. -726.]\n", + "[-1.5 -1.5 -1.5 -1.5 -1.5 -1.5 -1.5 -1.5 -1.5 -1.5 -1.5]\n" + ] + } + ], + "source": [ + "a = np.linspace(3, 33, 11)\n", + "b = np.linspace(-2, -22, 11)\n", + "print(a + b)\n", + "print(a - b)\n", + "print(a * b)\n", + "print(a / b)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Один из операндов может быть скаляром, а не массивом.***" + ] + }, + { + "cell_type": "code", + "execution_count": 29, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 15. 30. 45. 60. 75. 90. 105. 120. 135. 150. 165.]\n", + "[ 8. 6. 4. 2. 0. -2. -4. -6. -8. -10. -12.]\n" + ] + } + ], + "source": [ + "print(5*a)\n", + "print(10 + b)" + ] + }, + { + "cell_type": "code", + "execution_count": 30, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 1. 4. 9. 16. 25. 36. 49. 64. 81. 100. 121.]\n", + "[2.000e+00 4.000e+00 8.000e+00 1.600e+01 3.200e+01 6.400e+01 1.280e+02\n", + " 2.560e+02 5.120e+02 1.024e+03 2.048e+03]\n" + ] + } + ], + "source": [ + "print((a + b) ** 2)\n", + "print(2 ** (a + b))" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Если типы элементов разные, то идет каст к большему.***" + ] + }, + { + "cell_type": "code", + "execution_count": 31, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 3. 7. 11. 15. 19. 23. 27. 31. 35. 39. 43.]\n", + "\n" + ] + } + ], + "source": [ + "print(a + np.arange(11, dtype='int16'))\n", + "print(type(a[0]))" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***В ``Numpy`` есть элементарные функции, которые тоже применяются к массивам поэлементно. Они называются универсальными функциями (``ufunc``).***" + ] + }, + { + "cell_type": "code", + "execution_count": 32, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "numpy.ufunc" + ] + }, + "execution_count": 32, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "type(np.cos)" + ] + }, + { + "cell_type": "code", + "execution_count": 33, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([-0.9899925 , 0.96017029, -0.91113026, 0.84385396, -0.75968791,\n", + " 0.66031671, -0.54772926, 0.42417901, -0.29213881, 0.15425145,\n", + " -0.01327675])" + ] + }, + "execution_count": 33, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.cos(a)" + ] + }, + { + "cell_type": "code", + "execution_count": 34, + "metadata": {}, + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "/tmp/ipykernel_2722/4200754868.py:1: RuntimeWarning: invalid value encountered in log\n", + " np.log(b)\n" + ] + }, + { + "data": { + "text/plain": [ + "array([nan, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan])" + ] + }, + "execution_count": 34, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.log(b)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Логические операции также производятся поэлементно.***" + ] + }, + { + "cell_type": "code", + "execution_count": 35, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ True True True True True True True True True True True]\n", + "[False False False False False False False False False False False]\n", + "[False False False True True True True True True True True]\n" + ] + } + ], + "source": [ + "print(a > b)\n", + "print(a == b)\n", + "print(a >= 10)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Кванторы ``всеобщности`` и ``существования``.***\n", + "$$\\forall$$\n", + "$$\\exists$$" + ] + }, + { + "cell_type": "code", + "execution_count": 36, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "\n" + ] + } + ], + "source": [ + "c = np.arange(0., 20)\n", + "print(type(c[0]))" + ] + }, + { + "cell_type": "code", + "execution_count": 37, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "(True, False)" + ] + }, + "execution_count": 37, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.any(c == 0.), np.all(c)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Inplace операции.***" + ] + }, + { + "cell_type": "code", + "execution_count": 38, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[-0.7568025 0.2431975 1.2431975 2.2431975 3.2431975 4.2431975\n", + " 5.2431975 6.2431975 7.2431975 8.2431975 9.2431975 10.2431975\n", + " 11.2431975 12.2431975 13.2431975 14.2431975 15.2431975 16.2431975\n", + " 17.2431975 18.2431975]\n" + ] + } + ], + "source": [ + "c += np.sin(4)\n", + "print(c)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Inplace операции возможны только для операндов одинакового типа.***" + ] + }, + { + "cell_type": "code", + "execution_count": 39, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[-1.51360499 0.48639501 2.48639501 4.48639501 6.48639501 8.48639501\n", + " 10.48639501 12.48639501 14.48639501 16.48639501 18.48639501 20.48639501\n", + " 22.48639501 24.48639501 26.48639501 28.48639501 30.48639501 32.48639501\n", + " 34.48639501 36.48639501]\n" + ] + } + ], + "source": [ + "c *= 2\n", + "print(c)" + ] + }, + { + "cell_type": "code", + "execution_count": 40, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[-0.51360499 1.2431975 1.82879834 2.12159875 2.297279 2.41439917\n", + " 2.49805643 2.56079938 2.60959945 2.6486395 2.68058136 2.70719958\n", + " 2.72972269 2.74902821 2.76575967 2.78039969 2.79331735 2.80479972\n", + " 2.81507342 2.82431975]\n" + ] + } + ], + "source": [ + "b = np.arange(1., 21, 1)\n", + "\n", + "d = (b + c)\n", + "d /= b\n", + "print(d)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***При делении ``ndarray`` на нули, исключения не бросается.***" + ] + }, + { + "cell_type": "code", + "execution_count": 41, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 0. nan inf -inf]\n" + ] + }, + { + "name": "stderr", + "output_type": "stream", + "text": [ + "/tmp/ipykernel_2722/3088186758.py:1: RuntimeWarning: divide by zero encountered in divide\n", + " print(np.array([0.0, 0.0, 1.0, -1.0]) / np.array([1.0, 0.0, 0.0, 0.0]))\n", + "/tmp/ipykernel_2722/3088186758.py:1: RuntimeWarning: invalid value encountered in divide\n", + " print(np.array([0.0, 0.0, 1.0, -1.0]) / np.array([1.0, 0.0, 0.0, 0.0]))\n" + ] + } + ], + "source": [ + "print(np.array([0.0, 0.0, 1.0, -1.0]) / np.array([1.0, 0.0, 0.0, 0.0]))" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Могут понадобится константы.***" + ] + }, + { + "cell_type": "code", + "execution_count": 42, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "2.718281828459045 3.141592653589793\n" + ] + } + ], + "source": [ + "print(np.e, np.pi)" + ] + }, + { + "cell_type": "code", + "execution_count": 43, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18.\n", + " 19. 20.]\n", + "[ 1. 3. 6. 10. 15. 21. 28. 36. 45. 55. 66. 78. 91. 105.\n", + " 120. 136. 153. 171. 190. 210.]\n" + ] + } + ], + "source": [ + "print(b)\n", + "print(b.cumsum())" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Посмотрим на сортировку numpy-массивов.***" + ] + }, + { + "cell_type": "code", + "execution_count": 44, + "metadata": {}, + "outputs": [], + "source": [ + "a = np.array([1, 5, 6, 10, -2, 0, 18])" + ] + }, + { + "cell_type": "code", + "execution_count": 45, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[-2 0 1 5 6 10 18]\n", + "[ 1 5 6 10 -2 0 18]\n" + ] + } + ], + "source": [ + "print(np.sort(a))\n", + "print(a)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Теперь попробуем как метод.***" + ] + }, + { + "cell_type": "code", + "execution_count": 46, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[-2 0 1 5 6 10 18]\n" + ] + } + ], + "source": [ + "a.sort()\n", + "print(a)" + ] + }, + { + "cell_type": "code", + "execution_count": 47, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([1., 1., 1., 1., 1.])" + ] + }, + "execution_count": 47, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "b = np.ones(5)\n", + "b" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Объединим массивы.***" + ] + }, + { + "cell_type": "code", + "execution_count": 48, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([-2., 0., 1., 5., 6., 10., 18., 1., 1., 1., 1., 1., 5.,\n", + " 5., 5., 5., 5.])" + ] + }, + "execution_count": 48, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "c = np.hstack((a, b, 5*b))\n", + "c" + ] + }, + { + "cell_type": "code", + "execution_count": 49, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "\u001b[0;31mSignature:\u001b[0m \u001b[0mnp\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mhsplit\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mary\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mindices_or_sections\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", + "\u001b[0;31mDocstring:\u001b[0m\n", + "Split an array into multiple sub-arrays horizontally (column-wise).\n", + "\n", + "Please refer to the `split` documentation. `hsplit` is equivalent\n", + "to `split` with ``axis=1``, the array is always split along the second\n", + "axis except for 1-D arrays, where it is split at ``axis=0``.\n", + "\n", + "See Also\n", + "--------\n", + "split : Split an array into multiple sub-arrays of equal size.\n", + "\n", + "Examples\n", + "--------\n", + ">>> x = np.arange(16.0).reshape(4, 4)\n", + ">>> x\n", + "array([[ 0., 1., 2., 3.],\n", + " [ 4., 5., 6., 7.],\n", + " [ 8., 9., 10., 11.],\n", + " [12., 13., 14., 15.]])\n", + ">>> np.hsplit(x, 2)\n", + "[array([[ 0., 1.],\n", + " [ 4., 5.],\n", + " [ 8., 9.],\n", + " [12., 13.]]),\n", + " array([[ 2., 3.],\n", + " [ 6., 7.],\n", + " [10., 11.],\n", + " [14., 15.]])]\n", + ">>> np.hsplit(x, np.array([3, 6]))\n", + "[array([[ 0., 1., 2.],\n", + " [ 4., 5., 6.],\n", + " [ 8., 9., 10.],\n", + " [12., 13., 14.]]),\n", + " array([[ 3.],\n", + " [ 7.],\n", + " [11.],\n", + " [15.]]),\n", + " array([], shape=(4, 0), dtype=float64)]\n", + "\n", + "With a higher dimensional array the split is still along the second axis.\n", + "\n", + ">>> x = np.arange(8.0).reshape(2, 2, 2)\n", + ">>> x\n", + "array([[[0., 1.],\n", + " [2., 3.]],\n", + " [[4., 5.],\n", + " [6., 7.]]])\n", + ">>> np.hsplit(x, 2)\n", + "[array([[[0., 1.]],\n", + " [[4., 5.]]]),\n", + " array([[[2., 3.]],\n", + " [[6., 7.]]])]\n", + "\n", + "With a 1-D array, the split is along axis 0.\n", + "\n", + ">>> x = np.array([0, 1, 2, 3, 4, 5])\n", + ">>> np.hsplit(x, 2)\n", + "[array([0, 1, 2]), array([3, 4, 5])]\n", + "\u001b[0;31mFile:\u001b[0m ~/miniconda3/envs/py38/lib/python3.8/site-packages/numpy/lib/shape_base.py\n", + "\u001b[0;31mType:\u001b[0m function" + ] + } + ], + "source": [ + "?np.hsplit\n" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Расщепление массива.***" + ] + }, + { + "cell_type": "code", + "execution_count": 50, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[-2 0 1 5 6 10 18]\n", + "[-2 0 1]\n", + "[5 6]\n", + "[10]\n", + "[18]\n" + ] + } + ], + "source": [ + "x1, x2, x3, x4 = np.hsplit(a, [3, 5, 6])\n", + "print(a)\n", + "print(x1)\n", + "print(x2)\n", + "print(x3)\n", + "print(x4)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Функции ``append`` ``delete`` ``insert`` не Inplace функции.***" + ] + }, + { + "cell_type": "code", + "execution_count": 51, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[-2 5 10 18]\n", + "[-2 0 1 5 6 10 18]\n" + ] + } + ], + "source": [ + "print(np.delete(a, [2, 4, 1]))\n", + "print(a)" + ] + }, + { + "cell_type": "code", + "execution_count": 52, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([-2, 0, -1, -1, 1, 5, 6, 10, 18])" + ] + }, + "execution_count": 52, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.insert(a, 2, [-1, -1])" + ] + }, + { + "cell_type": "code", + "execution_count": 53, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([-2. , 0. , 1. , 5. , 6. , 10. , 18. , 2.2, 2.1])" + ] + }, + "execution_count": 53, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.append(a, [2.2, 2.1])" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Cрезы" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Массив в обратном порядоке.***" + ] + }, + { + "cell_type": "code", + "execution_count": 54, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([18, 10, 6, 5, 1, 0, -2])" + ] + }, + "execution_count": 54, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "a[::-1]" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Диапазон индексов. Создаётся новый заголовок массива, указывающий на те же данные. Изменения, сделанные через такой массив, видны и в исходном массиве.***" + ] + }, + { + "cell_type": "code", + "execution_count": 55, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[-2 0 1 5 6 10 18]\n" + ] + } + ], + "source": [ + "print(a)" + ] + }, + { + "cell_type": "code", + "execution_count": 56, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([1, 5, 6])" + ] + }, + "execution_count": 56, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "a[2:5]" + ] + }, + { + "cell_type": "code", + "execution_count": 57, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ -2 -1000 1 5 6 10 18]\n" + ] + } + ], + "source": [ + "b = a[0:6] # копия не создается\n", + "b[1] = -1000\n", + "print(a)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Диапозоны с шагами.***" + ] + }, + { + "cell_type": "code", + "execution_count": 58, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[-2 1]\n", + "[-2 0 1 5 0 10 18]\n" + ] + } + ], + "source": [ + "b = a[0:4:2]\n", + "print(b)\n", + "\n", + "# подмассиву можно присваивать скаляр\n", + "a[1:6:3] = 0\n", + "print(a)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Чтобы скопировать и данные массива, нужно использовать метод ``copy``.***" + ] + }, + { + "cell_type": "code", + "execution_count": 59, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[-2 0 -4 5 0 10 18]\n", + "[-2 0 1 5 0 10 18]\n" + ] + } + ], + "source": [ + "b = a.copy()\n", + "b[2] = -4\n", + "print(b)\n", + "print(a)" + ] + }, + { + "cell_type": "code", + "execution_count": 60, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[10 5 0]\n" + ] + } + ], + "source": [ + "print(a[[5,3,1]]) # массив индексов" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "**Задание 3:** \n", + "- Создать массив чисел от $-4\\pi$ до $4\\pi $, количество точек 100\n", + "- Посчитать сумму поэлементных квадратов синуса и косинуса для данного массива \n", + "- С помощью ``np.all`` проверить, что все элементы равны единице." + ] + }, + { + "cell_type": "code", + "execution_count": 61, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.\n", + " 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.\n", + " 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.\n", + " 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.\n", + " 1. 1. 1. 1.]\n" + ] + }, + { + "data": { + "text/plain": [ + "True" + ] + }, + "execution_count": 61, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "# решение\n", + "\n", + "x = np.linspace(-4*np.pi, 4*np.pi, 100)\n", + "print(np.sin(x)**2 + np.cos(x)**2)\n", + "np.all((np.sin(x)**2 + np.cos(x)**2).round() == 1)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Матрицы" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "**Определение**: *Матрицей размера $m \\times n$* нахывается прямоугольная таблица с числами из $m$ строк и $n$ столбцов: \n", + "\n", + "$$\\begin{pmatrix}x_{11}, x_{12}, ... , x_{1n}\\\\x_{21}, x_{22}, ... , x_{2n}\\\\...\\ \\ \\ ...\\ \\ \\ ...\\\\x_{m1}, x_{m2}, ... , x_{mn}\\\\\\end{pmatrix}$$" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "**Определение**: Квадратная матрица называется *(не)вырожденой*, если ее строки линейно (не)зависимы\n", + "$$\\begin{pmatrix}1\\ \\ \\ \\ \\ \\ 3\\ \\ \\ \\ \\ \\ -1\\\\0\\ \\ \\ \\ \\ \\ -2\\ \\ \\ \\ \\ \\ 0\\\\2\\ \\ \\ \\ \\ \\ 4\\ \\ \\ \\ \\ \\ -2 \\end{pmatrix}$$" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "**Утверждение**: Строки квадратной матрицы ЛНЗ тогда и только тогда, когда её столбцы ЛНЗ" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "**Определение**: *Строчным рангом* матрицы $A$ называется размер наибольшего подмножества линейно независимых строк $A$. Аналогчно определяется *столбцовый* ранг.\n", + "\n", + "**Пример**: \n", + "$$\\begin{pmatrix}1\\ \\ \\ \\ \\ \\ 0\\ \\ \\ \\ \\ \\ 0\\ \\ \\ \\ \\ \\ 5\\ \\ \\ \\ \\ \\ -2\\\\0\\ \\ \\ \\ \\ \\ 1\\ \\ \\ \\ \\ \\ 0\\ \\ \\ \\ \\ \\ 0\\ \\ \\ \\ \\ \\ -1\\\\0\\ \\ \\ \\ \\ \\ \\ 0\\ \\ \\ \\ \\ \\ \\ 1\\ \\ \\ \\ \\ \\ \\ 2\\ \\ \\ \\ \\ \\ \\ 3\\\\ \\end{pmatrix} \\\\ Строчный\\ и\\ столбцовый\\ ранг\\ равны\\ 3$$\n", + "\n", + "**Удтверждение**: Строчный и столбцовый ранг равны." + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "#### Умножение матрицы на вектор\n", + "\n", + "![](imgs/sem1/sem1_9.png)\n", + "\n", + "Пример с системой линейных уравнений, ее можно очень удобно записать в матричном виде:\n", + "\n", + "![](imgs/sem1/sem1_10.png)\n" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "##### Линейная регрессия в матричном виде\n", + "- Ищем закономерность в *линейном* виде $$y_k = w_1x_{k1} + w_2x_{k2} + ... + w_nx_{kn}$$\n", + "- В матричном виде уравнение записывается так: \n", + "$$Xw = y$$\n", + "$$X = \\begin{pmatrix}x_{11}, x_{12}, ... , x_{1n}\\\\x_{21}, x_{22}, ... , x_{2n}\\\\...\\ \\ \\ ...\\ \\ \\ ...\\\\x_{m1}, x_{m2}, ... , x_{mn}\\\\\\end{pmatrix}, w = \\begin{pmatrix}w_1\\\\w_2\\\\ ... \\\\ w_{n} \\end{pmatrix}, y = \\begin{pmatrix}w_1\\\\y_2\\\\ ... \\\\ y_{n} \\end{pmatrix}$$\n", + "\n", + "Любой алгоритм машинного обучения очень чувствителен к количеству объектов ($m$) и количеству признаков ($n$) в обучающей выборке:\n", + "\n", + "- Если $m = n$, то решение (скорее всего) единственное.\n", + "- Если $m > n$, то решение (скорее всего) нет.\n", + "- Если $m < n$, то решение (скорее всего) бесконечно много." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Матрицы в NumPy" + ] + }, + { + "cell_type": "code", + "execution_count": 62, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[1 2]\n", + " [3 4]]\n" + ] + } + ], + "source": [ + "a = np.array([[1, 2], [3, 4]])\n", + "print(a)" + ] + }, + { + "cell_type": "code", + "execution_count": 63, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "(2, (2, 2), 2, 4)" + ] + }, + "execution_count": 63, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "a.ndim, a.shape, len(a), a.size" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Обращение по индексу.***" + ] + }, + { + "cell_type": "code", + "execution_count": 64, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "(4, 4)" + ] + }, + "execution_count": 64, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "a[1][1], a[1,1]" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Атрибуту ``shape`` можно присвоить новое значение -- кортеж размеров по всем координатам. Получится новый заголовок массива; его данные не изменятся.***" + ] + }, + { + "cell_type": "code", + "execution_count": 65, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[ 0 1 2 3 4 5 6 7 8 9]\n", + " [10 11 12 13 14 15 16 17 18 19]]\n" + ] + } + ], + "source": [ + "b = np.arange(0, 20)\n", + "b.shape = (2, 10)\n", + "print(b)" + ] + }, + { + "cell_type": "code", + "execution_count": 66, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19]]\n" + ] + } + ], + "source": [ + "print(b.reshape((1,20))) # то же самое, что и shape" + ] + }, + { + "cell_type": "code", + "execution_count": 67, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19]\n" + ] + } + ], + "source": [ + "print(b.ravel()) # стягивание в одномерный массив" + ] + }, + { + "cell_type": "code", + "execution_count": 68, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[1. 1. 1.]\n", + " [1. 1. 1.]\n", + " [1. 1. 1.]]\n" + ] + } + ], + "source": [ + "a = np.ones((3, 3)) # подать tuple\n", + "print(a)" + ] + }, + { + "cell_type": "code", + "execution_count": 69, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[0. 0. 0. 0.]\n", + " [0. 0. 0. 0.]\n", + " [0. 0. 0. 0.]]\n" + ] + } + ], + "source": [ + "b = np.zeros((3, 4))\n", + "print(b)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "#### Операции над матрицами\n", + "\n", + "- Сложение матриц\n", + "- Умножение матриц\n", + "- Транспонирование и обратная матрица\n", + "- Определитель матрицы" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "##### Сложение матриц\n", + "- выполняется поэлементно\n", + "- Можно применять только к матрицам одинакового размера\n", + "\n", + "![](imgs/sem1/sem1_11.png)" + ] + }, + { + "cell_type": "code", + "execution_count": 70, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([[2., 2., 2.],\n", + " [2., 2., 2.],\n", + " [2., 2., 2.]])" + ] + }, + "execution_count": 70, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "a = np.ones((3, 3)) # подать tuple\n", + "b = np.ones((3, 3)) # подать tuple\n", + "\n", + "\n", + "a + b" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "##### Умножение матриц\n", + "\n", + "- Можно применять только к матрицам, в которых количество столбцов одной матрицы совпадает с количеством строк второй.\n", + "\n", + "![](imgs/sem1/sem1_12.png)\n", + "\n", + "Произведение матриц встречается, когда совокупность векторов умножается на матрицу (например при подаче в нейронную сеть батча данных)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "##### Свойства произведения матриц\n", + "- Ассоциативность: $A(BC) = (AB)C$\n", + "- Дистрибутивность: $A(B + C) = AB + АC$\n", + "- Отсутствие коммутативности: не всегда $AB = BA$\n", + "- Существование нейтрального элемента $E$ (Единичная матрица): $$\\begin{pmatrix}1\\ 0\\ ...\\ 0\\\\0\\ 1\\ ...\\ 0\\\\.........\\\\0\\ 0\\ ...\\ 1\\\\\\end{pmatrix}$$ $$AE = EA = A$$\n", + "- Для квадратных матриц: если $A$ вырождена, то $AB$ также вырождена" + ] + }, + { + "cell_type": "code", + "execution_count": 71, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([[1., 0., 0., 0., 0.],\n", + " [0., 1., 0., 0., 0.],\n", + " [0., 0., 1., 0., 0.],\n", + " [0., 0., 0., 1., 0.],\n", + " [0., 0., 0., 0., 1.]])" + ] + }, + "execution_count": 71, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.eye(5)" + ] + }, + { + "cell_type": "code", + "execution_count": 72, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[5. 5. 5. 5. 5.]\n", + " [5. 5. 5. 5. 5.]\n", + " [5. 5. 5. 5. 5.]\n", + " [5. 5. 5. 5. 5.]\n", + " [5. 5. 5. 5. 5.]] \n", + "\n", + "[[2. 1. 1. 1. 1.]\n", + " [1. 2. 1. 1. 1.]\n", + " [1. 1. 2. 1. 1.]\n", + " [1. 1. 1. 2. 1.]\n", + " [1. 1. 1. 1. 2.]]\n" + ] + } + ], + "source": [ + "a = 5*np.ones((5, 5))\n", + "b = np.eye(5) + 1\n", + "print(a, '\\n')\n", + "print(b)" + ] + }, + { + "cell_type": "code", + "execution_count": 73, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[10. 5. 5. 5. 5.]\n", + " [ 5. 10. 5. 5. 5.]\n", + " [ 5. 5. 10. 5. 5.]\n", + " [ 5. 5. 5. 10. 5.]\n", + " [ 5. 5. 5. 5. 10.]] \n", + "\n", + "[[30. 30. 30. 30. 30.]\n", + " [30. 30. 30. 30. 30.]\n", + " [30. 30. 30. 30. 30.]\n", + " [30. 30. 30. 30. 30.]\n", + " [30. 30. 30. 30. 30.]] \n", + "\n", + "[[30. 30. 30. 30. 30.]\n", + " [30. 30. 30. 30. 30.]\n", + " [30. 30. 30. 30. 30.]\n", + " [30. 30. 30. 30. 30.]\n", + " [30. 30. 30. 30. 30.]]\n" + ] + } + ], + "source": [ + "print(a * b, '\\n') # поэлементное умножение\n", + "print(a @ b, '\\n') # матричное умножение\n", + "print(a.dot(b)) " + ] + }, + { + "cell_type": "code", + "execution_count": 74, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[1. 0. 0.]\n", + " [0. 1. 0.]\n", + " [0. 0. 1.]]\n" + ] + } + ], + "source": [ + "c = np.eye(3)\n", + "print(c)" + ] + }, + { + "cell_type": "code", + "execution_count": 75, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[['1' '' '' '']\n", + " ['' '2' '' '']\n", + " ['' '' '3' '']\n", + " ['' '' '' 'a']]\n" + ] + } + ], + "source": [ + "d = np.diag([1, 2, 3, 'a'])\n", + "print(d)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Задание 4:***\n", + "Создать квадратную матрицу размера 8, на главной диаг. арифметическая прогрессия с шагом 3 (начиная с 3), а на побочной -1, остальные элементы 0." + ] + }, + { + "cell_type": "code", + "execution_count": 76, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[ 3. 0. 0. 0. 0. 0. 0. -1.]\n", + " [ 0. 6. 0. 0. 0. 0. -1. 0.]\n", + " [ 0. 0. 9. 0. 0. -1. 0. 0.]\n", + " [ 0. 0. 0. 12. -1. 0. 0. 0.]\n", + " [ 0. 0. 0. -1. 15. 0. 0. 0.]\n", + " [ 0. 0. -1. 0. 0. 18. 0. 0.]\n", + " [ 0. -1. 0. 0. 0. 0. 21. 0.]\n", + " [-1. 0. 0. 0. 0. 0. 0. 24.]]\n" + ] + } + ], + "source": [ + "# решение\n", + "# print(-1*np.eye(8)[::-1][::-1])\n", + "a = -1*np.eye(8)[::-1] + np.diag(np.arange(3, 27, 3))\n", + "print(a)\n" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "##### Обратная матрица\n", + "**Определение**: Пусть $A$ - квадратная матрица. Если существует такая матрица $A^{-1}$, что $AA^{-1} = A^{-1}A = E$, то матрица $A^{-1}$ называется *обратной матрицей* к $A$. Матрица $A$ в таком случае называется *обратимой*.\n", + "\n", + "**Утверждение**: Пусть $A$ - квадратная матрица. Если строки (или столбцы) $А$ линейно независимы (т.е. $A$ невырождена), то обратная матрица существует и единствена.\n", + "\n", + "##### Обратная матрица при решении СЛУ\n", + "\n", + "Есть СЛУ: $$Ax = b$$\n", + "\n", + "Если существует $A^{-1}$, то у системы есть единственное решение: $$x = A^{-1}b$$" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "##### Транспонированная матрица\n", + "\n", + "Транспонирование - операция отражения матрицы относительно главной диагонали. Обозначается как $A^{\\top}$\n", + "\n", + "Вектор-столбец при транспонировании переходит в вектор-строку. Поэтому скалярное произведение можно записать так: $$ = x^{\\top}y$$" + ] + }, + { + "cell_type": "code", + "execution_count": 77, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[0 1 2]\n", + " [4 5 6]]\n", + "\n", + "[[0 4]\n", + " [1 5]\n", + " [2 6]]\n" + ] + } + ], + "source": [ + "a = np.array([[0, 1, 2], [4, 5, 6]])\n", + "b = a.transpose()\n", + "print(a)\n", + "print()\n", + "print(b)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "##### Определитель матрицы\n", + "\n", + "Определитель квадратной матрицы - это ее числовая характеристика.\n", + "\n", + "- $\\mid a\\mid = a$\n", + "- $\\mid\\begin{pmatrix}a\\ b\\\\c\\ d \\end{pmatrix}\\mid = ad - bc$\n", + "\n", + "![](imgs/sem1/sem1_13.png)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "##### Свойства определителя\n", + "- $\\mid AB \\mid = \\mid A \\mid \\mid B \\mid$ \n", + "- $\\mid A \\mid = 0$ тогда и только тогда, когда $A$ вырожденная" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "##### Вычисление обратной матрицы с помощью определителей\n", + "\n", + "![](imgs/sem1/sem1_14.png)" + ] + }, + { + "cell_type": "code", + "execution_count": 78, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[2 1]\n", + " [2 3]]\n" + ] + } + ], + "source": [ + "a = np.array([[2, 1], [2, 3]])\n", + "print(a)" + ] + }, + { + "cell_type": "code", + "execution_count": 79, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "4.0" + ] + }, + "execution_count": 79, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.linalg.det(a)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Нахождениия обратной.***" + ] + }, + { + "cell_type": "code", + "execution_count": 80, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[ 0.75 -0.25]\n", + " [-0.5 0.5 ]]\n" + ] + } + ], + "source": [ + "b = np.linalg.inv(a)\n", + "print(b)" + ] + }, + { + "cell_type": "code", + "execution_count": 81, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[1. 0.]\n", + " [0. 1.]]\n", + "[[1. 0.]\n", + " [0. 1.]]\n" + ] + } + ], + "source": [ + "print(a.dot(b))\n", + "print(b.dot(a))" + ] + }, + { + "cell_type": "code", + "execution_count": 82, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[2 1]\n", + " [6 3]]\n", + "0.0\n" + ] + } + ], + "source": [ + "c = np.array([[2, 1], [6, 3]])\n", + "print(c)\n", + "print(np.linalg.det(c))" + ] + }, + { + "cell_type": "code", + "execution_count": 83, + "metadata": {}, + "outputs": [ + { + "ename": "LinAlgError", + "evalue": "Singular matrix", + "output_type": "error", + "traceback": [ + "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", + "\u001b[0;31mLinAlgError\u001b[0m Traceback (most recent call last)", + "Cell \u001b[0;32mIn[83], line 1\u001b[0m\n\u001b[0;32m----> 1\u001b[0m np\u001b[39m.\u001b[39;49mlinalg\u001b[39m.\u001b[39;49minv(c)\n", + "File \u001b[0;32m<__array_function__ internals>:200\u001b[0m, in \u001b[0;36minv\u001b[0;34m(*args, **kwargs)\u001b[0m\n", + "File \u001b[0;32m~/miniconda3/envs/py38/lib/python3.8/site-packages/numpy/linalg/linalg.py:538\u001b[0m, in \u001b[0;36minv\u001b[0;34m(a)\u001b[0m\n\u001b[1;32m 536\u001b[0m signature \u001b[39m=\u001b[39m \u001b[39m'\u001b[39m\u001b[39mD->D\u001b[39m\u001b[39m'\u001b[39m \u001b[39mif\u001b[39;00m isComplexType(t) \u001b[39melse\u001b[39;00m \u001b[39m'\u001b[39m\u001b[39md->d\u001b[39m\u001b[39m'\u001b[39m\n\u001b[1;32m 537\u001b[0m extobj \u001b[39m=\u001b[39m get_linalg_error_extobj(_raise_linalgerror_singular)\n\u001b[0;32m--> 538\u001b[0m ainv \u001b[39m=\u001b[39m _umath_linalg\u001b[39m.\u001b[39;49minv(a, signature\u001b[39m=\u001b[39;49msignature, extobj\u001b[39m=\u001b[39;49mextobj)\n\u001b[1;32m 539\u001b[0m \u001b[39mreturn\u001b[39;00m wrap(ainv\u001b[39m.\u001b[39mastype(result_t, copy\u001b[39m=\u001b[39m\u001b[39mFalse\u001b[39;00m))\n", + "File \u001b[0;32m~/miniconda3/envs/py38/lib/python3.8/site-packages/numpy/linalg/linalg.py:89\u001b[0m, in \u001b[0;36m_raise_linalgerror_singular\u001b[0;34m(err, flag)\u001b[0m\n\u001b[1;32m 88\u001b[0m \u001b[39mdef\u001b[39;00m \u001b[39m_raise_linalgerror_singular\u001b[39m(err, flag):\n\u001b[0;32m---> 89\u001b[0m \u001b[39mraise\u001b[39;00m LinAlgError(\u001b[39m\"\u001b[39m\u001b[39mSingular matrix\u001b[39m\u001b[39m\"\u001b[39m)\n", + "\u001b[0;31mLinAlgError\u001b[0m: Singular matrix" + ] + } + ], + "source": [ + "np.linalg.inv(c)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Решение НЛУ.***\n", + "$$ A \\cdot x = v $$" + ] + }, + { + "cell_type": "code", + "execution_count": 84, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 6.25 -7.5 ]\n", + "[ 6.25 -7.5 ]\n" + ] + } + ], + "source": [ + "v = np.array([5, -10])\n", + "print(np.linalg.solve(a, v))\n", + "print(b.dot(v))" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Найдем собственные вектора матрицы A.***\n", + "$$ A \\cdot x = \\lambda \\cdot x $$" + ] + }, + { + "cell_type": "code", + "execution_count": 85, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[1. 4.]\n", + "[[-0.70710678 -0.4472136 ]\n", + " [ 0.70710678 -0.89442719]]\n" + ] + } + ], + "source": [ + "l, u = np.linalg.eig(a)\n", + "print(l)\n", + "print(u)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Собственные значения матриц A и A.T совпадают.***" + ] + }, + { + "cell_type": "code", + "execution_count": 86, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[1. 4.]\n", + "[[-0.89442719 -0.70710678]\n", + " [ 0.4472136 -0.70710678]]\n" + ] + } + ], + "source": [ + "l, u = np.linalg.eig(a.T)\n", + "print(l)\n", + "print(u)" + ] + }, + { + "cell_type": "code", + "execution_count": 87, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[1. 1. 1.]\n", + "[[1. 0. 0.]\n", + " [0. 1. 0.]\n", + " [0. 0. 1.]]\n" + ] + } + ], + "source": [ + "l, u = np.linalg.eig(np.eye(3))\n", + "print(l)\n", + "print(u)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Еще чутка numpy" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Маски.***" + ] + }, + { + "cell_type": "code", + "execution_count": 88, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19]\n", + "[ True False False True False False True False False True False False\n", + " True False False True False False True False]\n", + "[ 0 3 6 9 12 15 18]\n" + ] + } + ], + "source": [ + "a = np.arange(20)\n", + "print(a)\n", + "print(a % 3 == 0)\n", + "print(a[a % 3 == 0])" + ] + }, + { + "cell_type": "code", + "execution_count": 89, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "[[10 0 0 0 0 0 0 0 0 0]\n", + " [ 0 11 0 0 0 0 0 0 0 0]\n", + " [ 0 0 12 0 0 0 0 0 0 0]\n", + " [ 0 0 0 13 0 0 0 0 0 0]\n", + " [ 0 0 0 0 14 0 0 0 0 0]\n", + " [ 0 0 0 0 0 15 0 0 0 0]\n", + " [ 0 0 0 0 0 0 16 0 0 0]\n", + " [ 0 0 0 0 0 0 0 17 0 0]\n", + " [ 0 0 0 0 0 0 0 0 18 0]\n", + " [ 0 0 0 0 0 0 0 0 0 19]]\n", + "145\n" + ] + } + ], + "source": [ + "b = np.diag(a[a >= 10])\n", + "print(b)\n", + "print(np.trace(b))" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Шлифонем тестами на производительность" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "***Производительность.***" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Без Numpy:" + ] + }, + { + "cell_type": "code", + "execution_count": 90, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "49999995000000\n", + "CPU times: user 469 ms, sys: 0 ns, total: 469 ms\n", + "Wall time: 503 ms\n" + ] + } + ], + "source": [ + "%%time\n", + "def summ(a):\n", + " ans = 0\n", + " for i in a:\n", + " ans += i\n", + " return ans\n", + "\n", + "arr = range(10**7)\n", + "\n", + "print(summ(arr))" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "C Numpy:" + ] + }, + { + "cell_type": "code", + "execution_count": 91, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "49999995000000\n", + "CPU times: user 15.6 ms, sys: 109 ms, total: 125 ms\n", + "Wall time: 108 ms\n" + ] + } + ], + "source": [ + "%%time\n", + "\n", + "sum_value = np.sum(np.arange(10**7))\n", + "print(sum_value)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Без Numpy:" + ] + }, + { + "cell_type": "code", + "execution_count": 92, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "CPU times: user 1.12 s, sys: 578 ms, total: 1.7 s\n", + "Wall time: 1.69 s\n" + ] + } + ], + "source": [ + "%%time\n", + "arr = []\n", + "n = 10**7\n", + "for i in range(n):\n", + " arr.append(i*5)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "С Numpy:" + ] + }, + { + "cell_type": "code", + "execution_count": 93, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "CPU times: user 93.8 ms, sys: 109 ms, total: 203 ms\n", + "Wall time: 216 ms\n" + ] + } + ], + "source": [ + "%%time\n", + "arr = 5*np.arange(10**7)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "# Лабораторная 1\n", + "\n", + "Решить 100 numpy задач, дедлайн `01.04.2023`\n", + "\n", + "https://github.com/rougier/numpy-100/blob/master/100_Numpy_exercises.ipynb" + ] + } + ], + "metadata": { + "kernelspec": { + "display_name": "py38", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.8.16" + }, + "orig_nbformat": 4, + "vscode": { + "interpreter": { + "hash": "c0330b53543e07ef1d56d28db427de4965ae0a62dafba4360eb741e652c9c2e1" + } + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} diff --git a/ml_system_design/seminars/sem3.ipynb b/ml_system_design/seminars/sem3.ipynb new file mode 100644 index 0000000..4015fec --- /dev/null +++ b/ml_system_design/seminars/sem3.ipynb @@ -0,0 +1,5343 @@ +{ + "cells": [ + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "Faqf8pG8itot" + }, + "source": [ + "## Линейные модели, градиентный спуск и метрики" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Линейная регрессия" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "KS-4su3tladF" + }, + "source": [ + "**Линейная регрессия** — модель зависимости переменной от одной или нескольких других переменных (факторов, регрессоров, независимых переменных) с линейной функцией зависимости.\n", + "\n", + "Ниже на графике представлена линейная регрессия переменной $y$ от переменной $x$.\n", + "\n", + "Есть коэффициент наклона $a$ и есть коэффициент сдвига $b$.\n", + "\n", + "Эти значения могут изменяться как угодно." + ] + }, + { + "cell_type": "code", + "execution_count": 1, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 283 + }, + "id": "monS6MN5k2I0", + "outputId": "059b12b9-1955-47cd-9422-26735ff519e1" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "import matplotlib.pyplot as plt\n", + "import numpy as np\n", + "\n", + "x = np.arange(-6, 6)\n", + "a = 2\n", + "b = 1\n", + "\n", + "y = a * x + b\n", + "plt.plot(x, y, label=f'y = {a}x + {b}')\n", + "plt.plot([0], [b], 'r*', markersize=10)\n", + "plt.ylabel('y');plt.xlabel('x')\n", + "plt.ylim(-10, 10);plt.xlim(-5, 5)\n", + "plt.grid()\n", + "plt.legend();" + ] + }, + { + "cell_type": "code", + "execution_count": 2, + "metadata": { + "id": "CrJiBTo4bN6h" + }, + "outputs": [], + "source": [ + "def draw_ax(a, b, x, ax, ylim=5):\n", + " y = a * x + b\n", + " ax.plot(x, y, label=f'y = {a}x + {b}')\n", + " ax.plot([0], [b], 'r*', markersize=10)\n", + " \n", + " ax.plot([0, 1], [b, b], 'y', linewidth=2)\n", + " ax.plot([1, 1], [b, b+a], 'y', linewidth=2)\n", + "\n", + " ax.set_ylabel('y'); ax.set_xlabel('x')\n", + " ax.set_ylim(-ylim, ylim); ax.set_xlim(-5, 5)\n", + " ax.grid()\n", + " ax.legend(prop={'size': 10})" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "XQw67GHzmD3h" + }, + "source": [ + "**Сдвиг**:\n", + "- Если у нас не будет сдвига (коэффициента $b$), то линяя будет проходить через точку (0, 0).\n", + "- Если коэффициент сдвига не равен 0, а к примеру, равен 2, то линяя будет проходить через точку (0, 2).\n", + "\n", + "**Коэффициент наклона**:\n", + "- Если у нас не будет коэффициента наклона, то линяя будет параллельна оси Ох.\n", + "- Если коэффициент наклона больше 0, то линяя идет на увеличение, при этом чем больше коэффициент, тем более наклон крутой.\n", + "- Если коэффициент наклона меньше 0, то линяя идет на уменьшение, при этом чем меньше коэффициент, тем более наклон крутой.\n", + "\n" + ] + }, + { + "cell_type": "code", + "execution_count": 3, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 606 + }, + "id": "lYWYDdbymzQ_", + "outputId": "00c3c0e7-d7a7-41d7-be62-0cb1aba977cd" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "import matplotlib.pyplot as plt\n", + "import numpy as np\n", + "\n", + "\n", + "fig, ax = plt.subplots(2, 3, figsize=(10, 6))\n", + "x = np.arange(-6, 6)\n", + "\n", + "# 1row, 1column\n", + "a, b = 0, 0\n", + "draw_ax(a, b, x, ax[0][0])\n", + "\n", + "# 1row, 2column\n", + "a, b = 1, 0\n", + "draw_ax(a, b, x, ax[0][1])\n", + "\n", + "# 1row, 3column\n", + "a, b = 0.5, 0\n", + "draw_ax(a, b, x, ax[0][2])\n", + "\n", + "\n", + "# 2row, 1column\n", + "a, b = 0, 2\n", + "draw_ax(a, b, x, ax[1][0])\n", + "\n", + "# 2row, 2column\n", + "a, b = -1, 2\n", + "draw_ax(a, b, x, ax[1][1])\n", + "\n", + "# 2row, 3column\n", + "a, b = -0.5, -2\n", + "draw_ax(a, b, x, ax[1][2])" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "usj8aWL8-84W" + }, + "source": [ + "С самим уравнением прямой разобрались, теперь давайте обучим линейную регрессию, ведь по факту она и есть прямая." + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "RmcjY5KeviKG" + }, + "source": [ + "#### Получение данных" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "VbgNr2MC7c9H" + }, + "source": [ + "Возьмем и сами нагенирируем себе данные и обучим на них линейную модель." + ] + }, + { + "cell_type": "code", + "execution_count": 4, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 1000 + }, + "id": "px8DWvILiEae", + "outputId": "8f12c244-f8f3-48f6-c732-d605cde16d88" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "array([[ 0.63007982],\n", + " [-1.06163445],\n", + " [ 0.29634711],\n", + " [ 1.40277112],\n", + " [ 0.68968231],\n", + " [-0.53662936],\n", + " [-1.11947526],\n", + " [ 1.06755846],\n", + " [ 0.1178195 ],\n", + " [ 1.54907163],\n", + " [ 1.29561858],\n", + " [-0.03107509],\n", + " [ 0.56119218],\n", + " [ 0.42105072],\n", + " [-0.4864951 ],\n", + " [ 0.08897764],\n", + " [-0.18577532],\n", + " [-0.17809318],\n", + " [-0.23725045],\n", + " [-0.88623967],\n", + " [-0.47573349],\n", + " [ 0.21734821],\n", + " [-2.65331856],\n", + " [ 0.72575222],\n", + " [-0.38053642],\n", + " [-0.48456513],\n", + " [ 1.57463407],\n", + " [-1.30554851],\n", + " [-0.17241977],\n", + " [ 0.73683739],\n", + " [-1.23234621],\n", + " [ 0.31540267],\n", + " [ 1.74945474],\n", + " [ 0.09183837],\n", + " [-0.30957664],\n", + " [-1.18575527],\n", + " [-0.68344663],\n", + " [-0.31963136],\n", + " [-0.00828463],\n", + " [-0.64257539],\n", + " [ 1.0956297 ],\n", + " [ 0.06367166],\n", + " [-0.57395456],\n", + " [ 0.07349324],\n", + " [ 0.73227135],\n", + " [-1.06560298],\n", + " [-1.68411089],\n", + " [-1.54686257],\n", + " [-0.20437532],\n", + " [-0.286073 ]])" + ] + }, + "metadata": {}, + "output_type": "display_data" + }, + { + "data": { + "text/plain": [ + "array([ 43.6543408 , -72.68235021, 21.19644643, 107.58765071,\n", + " 69.62063217, -32.57566222, -101.61213107, 87.44514699,\n", + " 17.69898683, 131.00190463, 97.97802247, 2.70819092,\n", + " 52.42715419, 27.74476129, -31.82947365, 1.58209228,\n", + " -9.72570848, 4.57391214, -33.24586607, -74.34292886,\n", + " -22.6419015 , 15.84607909, -202.79645668, 49.05026172,\n", + " -34.9916168 , -33.95608308, 121.78273292, -123.72382672,\n", + " -1.90918067, 64.06753923, -91.73785524, 9.55252237,\n", + " 148.12427806, 22.21183346, -16.35144507, -113.95075954,\n", + " -47.70966758, -22.69082132, -1.79022499, -58.17761844,\n", + " 91.76970817, -12.7798199 , -38.1435921 , 17.48650737,\n", + " 40.52468632, -107.65815151, -134.20798669, -127.22516755,\n", + " -34.31360406, -10.90920383])" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "from sklearn.datasets import make_regression\n", + "\n", + "X, y = make_regression(n_samples=50, n_features=1, n_informative=1,\n", + " noise=10, random_state=11)\n", + "\n", + "display(X, y)" + ] + }, + { + "cell_type": "code", + "execution_count": 5, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 388 + }, + "id": "CsCmE9Clj68Z", + "outputId": "8f142659-863a-477a-fb80-05d8a7f9b393" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "import matplotlib.pyplot as plt\n", + "\n", + "\n", + "fig = plt.figure(figsize=(10, 6))\n", + "plt.scatter(X, y)\n", + "\n", + "plt.xlabel('feature')\n", + "plt.ylabel('target')\n", + "plt.show()" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "wuQyanTXsg4P" + }, + "source": [ + "#### Одномерная линейная регрессия" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "2MnA-YZHBxzL" + }, + "source": [ + "##### Из sklearn" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "uJFYdPE1_TGm" + }, + "source": [ + "Возьмем модель `LinearRegression` из `sklearn` из модуля `linear_model`." + ] + }, + { + "cell_type": "code", + "execution_count": 6, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "LsrXG6K5_aLV", + "outputId": "ffd3f68d-0274-4fdf-f013-b3838092ff39" + }, + "outputs": [ + { + "data": { + "text/html": [ + "
LinearRegression()
In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.
" + ], + "text/plain": [ + "LinearRegression()" + ] + }, + "execution_count": 6, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from sklearn.linear_model import LinearRegression\n", + "\n", + "model = LinearRegression()\n", + "model" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "s5qE3TNG_h0_" + }, + "source": [ + "И передадим в неё в метод `fit` данные, которые получили выше." + ] + }, + { + "cell_type": "code", + "execution_count": 7, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "h8weuRBk_mHJ", + "outputId": "8017dcfd-345a-48ee-a1e4-a9a1a295d86d" + }, + "outputs": [ + { + "data": { + "text/html": [ + "
LinearRegression()
In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.
" + ], + "text/plain": [ + "LinearRegression()" + ] + }, + "execution_count": 7, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "model.fit(X, y)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "rS1iXWQG_nz0" + }, + "source": [ + "Всё, модель обучилась, это происходит очень быстро. Обучение линейной модели заключается в поиске коэффициентов, конкретно в нашей задаче - это коэффициент сдвига и наклона." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "Yp23Hf8h_5ji" + }, + "source": [ + "Можем эти коэффициента отобразить, если возьмем у модели атрибут `coef_` и `intercept_`." + ] + }, + { + "cell_type": "code", + "execution_count": 8, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "8RoiC6eN_-8Z", + "outputId": "3885a9b0-3b4e-4172-da10-bad49e8772c5" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "(array([80.41862354]), 0.18171887542100862)" + ] + }, + "execution_count": 8, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "model.coef_, model.intercept_" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "pFDck5gNBHG6" + }, + "source": [ + "Вот и получили два коэффициента, осталось их подставить в уравнение прямой и будет готовая линейная модель." + ] + }, + { + "cell_type": "code", + "execution_count": 9, + "metadata": { + "id": "UFJn6GsFBaD7" + }, + "outputs": [], + "source": [ + "model_a = model.coef_[0]\n", + "model_b = model.intercept_" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "NzfeXeeJHkMe" + }, + "source": [ + "Данная прямая наилучшим образом прошла вдоль точек из обучающей выборки." + ] + }, + { + "cell_type": "code", + "execution_count": 10, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 388 + }, + "id": "RuEUmXzTBPDE", + "outputId": "9b8ca55c-cfae-474e-f08a-c07166020dc5" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "fig = plt.figure(figsize=(10, 6))\n", + "\n", + "x = np.arange(-3, 3)\n", + "model_y_sk = model_a * x + model_b\n", + "\n", + "plt.plot(x, model_y_sk, linewidth=2, c='r', label=f'linear_model = {model_a:.2f}x + {model_b:.2f}')\n", + "plt.scatter(X, y) \n", + "plt.plot([0, 1], [model_b, model_b], 'y', linewidth=3)\n", + "plt.plot([1, 1], [model_b, model_b+model_a], 'y', linewidth=3)\n", + "plt.grid()\n", + "plt.xlabel('feature')\n", + "plt.ylabel('target')\n", + "plt.legend(prop={'size': 16})\n", + "plt.show()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "0bPamEKfa5rK" + }, + "source": [ + "Чтобы теперь сделать предсказания этой моделью достаточно вызвать метод `predict` и передать в него данные." + ] + }, + { + "cell_type": "code", + "execution_count": 11, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "86a7D1DLbIzm", + "outputId": "225a5377-a197-42eb-8290-b8268c33d056" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "(array([[0.63007982]]), array([50.85187092]))" + ] + }, + "execution_count": 11, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "pred = model.predict(X[:1])\n", + "\n", + "X[:1], pred" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "WPgV0jDvbTci" + }, + "source": [ + "Или же можем можем сделать точно такое же предсказание, если возьмем коэффициент наклона и умножим на значение признака и прибавим к этому коэффициент сдвига. " + ] + }, + { + "cell_type": "code", + "execution_count": 12, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "ssT9MavubmJZ", + "outputId": "c2a0116a-752d-4dc9-8318-c0ba4b87213d" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "array([[50.85187092]])" + ] + }, + "execution_count": 12, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "model_a * X[:1] + model_b" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "LyRlTyGBICT6" + }, + "source": [ + "А что значит это \"наилучшим образом вдоль точек из обучающей выборки\"? Как подсчитался этот наилучший образ?" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "3Fon3qOWIS7P" + }, + "source": [ + "Чем построенная линия ниже, хуже первой?" + ] + }, + { + "cell_type": "code", + "execution_count": 13, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 388 + }, + "id": "8mGFavM-IXUB", + "outputId": "e92cd78b-486c-468f-a127-421c2b2208fe" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "fig = plt.figure(figsize=(10, 6))\n", + "\n", + "x = np.arange(-3, 3)\n", + "a, b = 50, 0\n", + "model_y = a * x + b\n", + "\n", + "plt.plot(x, model_y, linewidth=2, c='r', label=f'linear_model = {a:.2f}x + {b:.2f}')\n", + "plt.scatter(X, y) \n", + "plt.plot([0, 1], [b, b], 'y', linewidth=3)\n", + "plt.plot([1, 1], [b, b+a], 'y', linewidth=3)\n", + "plt.grid()\n", + "plt.xlabel('feature')\n", + "plt.ylabel('target')\n", + "plt.legend(prop={'size': 16})\n", + "plt.show()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "OKsxKEysIb8w" + }, + "source": [ + "А визуально она допускает больше отклонений от синих точек, чем первая. Давайте сравним не визуально, а с помощью цифр." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "PK43OAJOJ9nh" + }, + "source": [ + "Для начала составим все данные в одну таблицу:\n", + "- `X` - это точки, на которых строим модель\n", + "- `y` - это настоящая целевая переменная, которую хотим предсказать\n", + "- `pred_model_good` - это значения на линии по координатам `X` первой модели, имеем предсказания модель `LinearRegression`\n", + "- и `pred_bad_model` - это значения на линии по координатам `X` второй модели, которая создана вручную, а не силами `sklearn`" + ] + }, + { + "cell_type": "code", + "execution_count": 14, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 206 + }, + "id": "596LHapcI8Ra", + "outputId": "11c37a82-ca4f-4246-add1-fdc308197537" + }, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
Xypred_good_modelpred_bad_model
00.63008043.65434150.85187131.503991
1-1.061634-72.682350-85.193462-53.081722
20.29634721.19644624.01354514.817355
31.402771107.587651112.99064170.138556
40.68968269.62063255.64502134.484116
\n", + "
" + ], + "text/plain": [ + " X y pred_good_model pred_bad_model\n", + "0 0.630080 43.654341 50.851871 31.503991\n", + "1 -1.061634 -72.682350 -85.193462 -53.081722\n", + "2 0.296347 21.196446 24.013545 14.817355\n", + "3 1.402771 107.587651 112.990641 70.138556\n", + "4 0.689682 69.620632 55.645021 34.484116" + ] + }, + "execution_count": 14, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "import pandas as pd\n", + "\n", + "df = pd.DataFrame({\n", + " 'X': X[:,0],\n", + " 'y': y,\n", + " 'pred_good_model': model_a * X[:,0] + model_b,\n", + " 'pred_bad_model': a * X[:,0] + b\n", + "})\n", + "\n", + "\n", + "df.head()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "Mw9kAfmtK4Pw" + }, + "source": [ + "Посчитаем отклонения предсказаний от истины для каждой модели.\n", + "\n", + "И здесь на первых 5 объектах тоже видим, что на `sklearn` модели более маленькие отклонения, нежели на второй модели." + ] + }, + { + "cell_type": "code", + "execution_count": 15, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 206 + }, + "id": "YeSOjxBjK8I7", + "outputId": "1bfceed7-8cb4-4c42-abe3-ed9fc728c3ef" + }, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
Xypred_good_modelpred_bad_modelresidual_goodresidual_bad
00.63008043.65434150.85187131.5039917.197530-12.150350
1-1.061634-72.682350-85.193462-53.081722-12.51111219.600628
20.29634721.19644624.01354514.8173552.817099-6.379091
31.402771107.587651112.99064170.1385565.402991-37.449095
40.68968269.62063255.64502134.484116-13.975611-35.136517
\n", + "
" + ], + "text/plain": [ + " X y pred_good_model pred_bad_model residual_good \\\n", + "0 0.630080 43.654341 50.851871 31.503991 7.197530 \n", + "1 -1.061634 -72.682350 -85.193462 -53.081722 -12.511112 \n", + "2 0.296347 21.196446 24.013545 14.817355 2.817099 \n", + "3 1.402771 107.587651 112.990641 70.138556 5.402991 \n", + "4 0.689682 69.620632 55.645021 34.484116 -13.975611 \n", + "\n", + " residual_bad \n", + "0 -12.150350 \n", + "1 19.600628 \n", + "2 -6.379091 \n", + "3 -37.449095 \n", + "4 -35.136517 " + ] + }, + "execution_count": 15, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df['residual_good'] = df['pred_good_model'] - df['y']\n", + "df['residual_bad'] = df['pred_bad_model'] - df['y']\n", + "df.head()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "-l8fSDyULRLR" + }, + "source": [ + "Давайте теперь на всех объектах посчитаем метрику, которая будет позволять оценивать качество построенных линий.\n", + "\n", + "Возьмем MSE - mean squared error." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "KB2SivGPL0pq" + }, + "source": [ + "MSE на sklearn модели равняется." + ] + }, + { + "cell_type": "code", + "execution_count": 16, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "HAZLA4slLz-b", + "outputId": "58806d83-9bf8-4cc7-bcae-f810e8120a39" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "111.93097544862607" + ] + }, + "execution_count": 16, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.mean(df['residual_good'] ** 2)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "o6TH3Ym2MGtv" + }, + "source": [ + "А MSE на второй модели равняется:" + ] + }, + { + "cell_type": "code", + "execution_count": 17, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "EabHNLaMMGt8", + "outputId": "65204e86-74a5-4df4-9e17-08db98f565bd" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "873.1554374932329" + ] + }, + "execution_count": 17, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.mean(df['residual_bad'] ** 2)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "VL93OuOCMKlR" + }, + "source": [ + "В разы больше, чем на первой модели." + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "hikZUrXxsqE4" + }, + "source": [ + "##### Как обучается линейная регрессия" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "4CivR_6rCVN1" + }, + "source": [ + "*Как же модель из `sklearn` умудрилась построить такие качественные предсказания?* Ведь у неё была куча вариантов построения, можно менять коэффициенты наклона и сдвига как угодно.\n", + "\n", + "Ответ на вопрос - **методы оптимизации**." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "xvDvoalkMmkW" + }, + "source": [ + "Ведь ошибка MSE тоже своего рода функция, которая меняется от коэффициента сдвига и наклона.\n", + "\n", + "Можем взять по 100 разных значений коэффициентов сдвига и наклона и посчитать в них MSE и отобразить на трехмерном графике.\n", + "\n", + "Так же отобразим и коэффициента, подобранные моделью из sklearn и наши коэффициенты." + ] + }, + { + "cell_type": "code", + "execution_count": 18, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 575 + }, + "id": "MYSGND_5NNii", + "outputId": "3d169bda-23db-4cc9-d98c-f4a990193aa9" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "from mpl_toolkits.mplot3d.axes3d import Axes3D\n", + "\n", + "\n", + "def mse(w1, w0):\n", + " y_pred = w1 * X[:, 0] + w0\n", + " return np.mean((y - y_pred) ** 2)\n", + "\n", + "\n", + "coefs_a = np.linspace(50, 100, num=100)\n", + "coefs_b = np.linspace(-10, 10, num=100)\n", + "w1, w0 = np.meshgrid(coefs_a, coefs_b)\n", + "\n", + "\n", + "fig = plt.figure(figsize=(15, 12))\n", + "ax = fig.add_subplot(111, projection='3d')\n", + "\n", + "zs = np.array([mse(i, j) for i, j in zip(np.ravel(w1), np.ravel(w0))])\n", + "Z = zs.reshape(w1.shape)\n", + "\n", + "ax.plot_surface(w1, w0, Z, alpha=.5)\n", + "ax.scatter(model_a, model_b, mse(model_a, model_b), c='r', s=5)\n", + "ax.scatter(a, b, mse(a, b), c='r', s=5)\n", + "\n", + "ax.set_xlabel(r'$w_1$')\n", + "ax.set_ylabel(r'$w_0$')\n", + "ax.set_zlabel('MSE')\n", + "\n", + "plt.show()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "Z6h9XzopP8Ou" + }, + "source": [ + "И видим, что дейстивительно, модель с коэффициентом `a` равным где-то 80, и с небольшим коэффициентом `b` лучше, чем модель с коэффициентом `a=50`, ведь ошибка у второй модели выше, чем у первой.\n", + "\n" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "V4LqAG5jsyQj" + }, + "source": [ + "##### Градиентный спуск" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "PmbkaRRNQ5SX" + }, + "source": [ + "*Как модель дошла до самой лучшей точки?*\n", + "\n", + "А она обучалась с помощью градиентного спуска - это метод оптимизации." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "dA1lWisVRnq7" + }, + "source": [ + "**Обсудим, что такое градиент и зачем надо спускаться.**\n", + "\n", + "_Градиентом_ функции $f$ называется $n$-мерный вектор из частных производных. \n", + "\n", + "$$ \\nabla f(x_{1},...,x_{d}) = \\left(\\frac{\\partial f}{\\partial x_{i}}\\right)^{d}_{i=1}.$$\n", + "\n", + "К примеру, если функция зависит от трех переменных: $F(x, y, z)$, то её градиент будет равен \n", + "\n", + "$$\\nabla f(x, y, z) = (\\frac{\\partial f}{\\partial x}, \\frac{\\partial f}{\\partial y}, \\frac{\\partial f}{\\partial z}) $$\n", + "\n", + "При этом, __градиент задает направление наискорейшего роста функции__. Значит, антиградиент будет показывать направление ее скорейшего убывания, что будет полезно нам в нашей задаче минимизации функционала ошибки. \n", + "\n", + "**Градиентный спуск** — метод нахождения локального минимума с помощью движения вдоль антиградиента." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "K88irooYxpS9" + }, + "source": [ + "Давайте попробуем реализовать программно градиентный спуск, чтобы лучше понять как он работает." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "zxKpYu5bWRH6" + }, + "source": [ + "Зададим две функции:\n", + "1. func - функция параболы $f(x) = x^2$\n", + "2. gr_func - производная функции параболы $\\nabla f(x) = 2x$" + ] + }, + { + "cell_type": "code", + "execution_count": 19, + "metadata": { + "id": "WYxZMCWzWQlS" + }, + "outputs": [], + "source": [ + "def func(x):\n", + " return x ** 2\n", + "\n", + "# функция градиента\n", + "def gr_func(x):\n", + " return 2 * x" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "pJdDL_TvWufg" + }, + "source": [ + "Можем отрисовать эту функцию на графике.\n", + "\n", + "Действительно видим параболу." + ] + }, + { + "cell_type": "code", + "execution_count": 20, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 374 + }, + "id": "TFnN5zo6Wmqw", + "outputId": "c5d9f425-9a76-4a58-c1a4-1b4265ac2765" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "# для картинки\n", + "D = 5\n", + "\n", + "X = np.linspace(-D, +D, 20)\n", + "Y = func(X)\n", + "\n", + "plt.figure(figsize=(16, 6))\n", + "plt.plot(X, Y, 'r', label='Y(X)');" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "gpghPbl5W3nY" + }, + "source": [ + "Чтобы найти минимум этой функции мы можем воспользоваться методом оптимизации - градиентный спуск, для этого нужно задать начальную точку, откуда будем считать градиенты и скатываться в минимум.\n", + "\n", + "Зеленая звездочка - это и есть точка старта." + ] + }, + { + "cell_type": "code", + "execution_count": 21, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 374 + }, + "id": "a4CEhDEWXJMW", + "outputId": "a1e964b2-a644-45b6-9e0b-0bf862b56b57" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "" + ] + }, + "execution_count": 21, + "metadata": {}, + "output_type": "execute_result" + }, + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "# первоначальное точка\n", + "start_point = 5\n", + "\n", + "# для картинки\n", + "D = 10\n", + "\n", + "X = np.linspace(-D, +D, 20)\n", + "Y = func(X)\n", + "\n", + "plt.figure(figsize=(16, 6))\n", + "plt.plot(X, Y, 'r', label='Y(X)')\n", + "plt.plot(start_point, func(start_point), '-*g', label = 'GD');\n", + "plt.legend()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "OZY4SxJ8XuaB" + }, + "source": [ + "Теперь в этой точке можем посчитать градиент.\n", + "\n", + "Он равняется 10, т.к. начальная точка равна 5, а производная будет равняться $\\nabla f(x) = 2\\cdot x = 2 \\cdot 5 = 10$ " + ] + }, + { + "cell_type": "code", + "execution_count": 22, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "bgQK7dm4ZOVw", + "outputId": "dc512a3c-90fb-4584-db79-7b0cc6fd7916" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "10" + ] + }, + "execution_count": 22, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "grad = gr_func(start_point)\n", + "grad" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "wxB4rqsKZO3K" + }, + "source": [ + "Можем отрисовать направление градиента, он показывает наискорейший рост функции и действительно видим, зеленый вектор идет вверх. " + ] + }, + { + "cell_type": "code", + "execution_count": 23, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 374 + }, + "id": "3G3-ggQ6X45x", + "outputId": "79574137-244f-4060-bccc-498d7f0d3cbe" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "plt.figure(figsize=(16, 6))\n", + "plt.plot(X, Y, 'r', label='Y(X)')\n", + "plt.plot(start_point, func(start_point), '*g', label='start_point')\n", + "\n", + "next_point_1 = start_point + grad\n", + "plt.plot([start_point, next_point_1], func(np.array([start_point, next_point_1])), '--g', label='grad')\n", + "plt.legend();" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "xMI7xm24Zo0h" + }, + "source": [ + "Но если будем двигаться по этому вектору, то к минимуму функции не придем, поэтому нужно идти в противоположгном направлении, а значит брать **антиградиент**.\n", + "\n", + "Но если мы пойдем от текущей точке $5$ в сторону антиградиента $-10$, то окажемся в точке $-5$, а это так же удалено от минимума, как и наша стартовая точка." + ] + }, + { + "cell_type": "code", + "execution_count": 24, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 374 + }, + "id": "AHzUE456ZyQS", + "outputId": "c22df950-a4b3-415e-f410-f2d98b415614" + }, + "outputs": [ + { + "data": { + "image/png": "iVBORw0KGgoAAAANSUhEUgAABRAAAAH5CAYAAAD5mBLdAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjcuMSwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy/bCgiHAAAACXBIWXMAAA9hAAAPYQGoP6dpAACDqUlEQVR4nOzdeZiNdePH8fcZ+zZj38qWh2hVSEq7UtosbaJo0apSUmnRniI9JZVWS5u0KO1J0Sahp0VEC1GyhRn7MHN+f3x/0ZSRYWbuOTPv13Wdy33OuefMB+OY+dzfJRaPx+NIkiRJkiRJ0lYkRR1AkiRJkiRJUsFlgShJkiRJkiQpWxaIkiRJkiRJkrJlgShJkiRJkiQpWxaIkiRJkiRJkrJlgShJkiRJkiQpWxaIkiRJkiRJkrJVPOoAOyIzM5OFCxdSoUIFYrFY1HEkSZIkSZKkhBKPx1m1ahW1a9cmKWnbYwwTskBcuHAhderUiTqGJEmSJEmSlNAWLFjArrvuus1zErJArFChAhB+g8nJyRGnkSRJkiRJkhJLWloaderU2dyzbUtCFoh/TltOTk62QJQkSZIkSZJ20PYsD+gmKpIkSZIkSZKyZYEoSZIkSZIkKVsWiJIkSZIkSZKyZYEoSZIkSZIkKVsWiJIkSZIkSZKyZYEoSZIkSZIkKVsWiJIkSZIkSZKyZYEoSZIkSZIkKVsWiJIkSZIkSZKyZYEoSZIkSZIkKVsWiJIkSZIkSZKyZYEoSZIkSZIkKVsWiJIkSZIkSZKyZYEoSZIkSZIkKVs5LhA/+ugjTjzxRGrXrk0sFuPVV1/N8nw8Hqd///7UqlWLMmXK0LZtW3744Ycs5yxfvpyuXbuSnJxMxYoVOe+881i9evVO/UYkSZIkSZIk5b4cF4hr1qxh33335aGHHtrq8wMHDmTIkCEMGzaMKVOmUK5cOdq1a8f69es3n9O1a1e+++47xo8fzxtvvMFHH33EBRdcsOO/C0mSJEmSJEl5IhaPx+M7/MGxGGPHjqVDhw5AGH1Yu3Zt+vTpw9VXXw1AamoqNWrUYMSIEZxxxhnMmjWLPfbYg6lTp9KiRQsA3nnnHdq3b8+vv/5K7dq1//XzpqWlkZKSQmpqKsnJyTsav2Bbtw7KlIk6hSRJkiRJUtFUyLuZnPRruboG4ty5c1m0aBFt27bd/FhKSgqtWrVi8uTJAEyePJmKFStuLg8B2rZtS1JSElOmTNnq627YsIG0tLQst0Lt5ZehQQOYOjXqJJIkSZIkSUXPkiXQuDEMHAiZmVGniVyuFoiLFi0CoEaNGlker1GjxubnFi1aRPXq1bM8X7x4cSpXrrz5nL8bMGAAKSkpm2916tTJzdgFz5gxsHgxdO0Krg0pSZIkSZKUf+JxOPdc+PVXeOYZSE+POlHkEmIX5n79+pGamrr5tmDBgqgj5a1HHoFddoEffoCrroo6jSRJkiRJUtExbBi8+SaUKgXPPgulS0edKHK5WiDWrFkTgMWLF2d5fPHixZufq1mzJkuWLMny/KZNm1i+fPnmc/6uVKlSJCcnZ7kVapUrw6hREIvB44/D33a6liRJkiRJUh74/nvo0ycc33037L13tHkKiFwtEBs0aEDNmjWZMGHC5sfS0tKYMmUKrVu3BqB169asXLmS6dOnbz7ngw8+IDMzk1atWuVmnMR25JFbvmDPPx9+/z3aPJIkSZIkSYVZenpYTm7dOjj6aLj88qgTFRg5LhBXr17NV199xVdffQWEjVO++uor5s+fTywWo3fv3txxxx2MGzeOb7/9lrPPPpvatWtv3qm5adOmHHvssfTs2ZMvvviCTz/9lF69enHGGWds1w7MRcodd0CzZvDHH2Hu/Y5vmC1JkiRJkqRtuflm+PJLqFIFRoyApIRY+S9fxOLxnLVSEydO5IgjjvjH4927d2fEiBHE43FuvvlmHnvsMVauXEmbNm14+OGHady48eZzly9fTq9evXj99ddJSkqic+fODBkyhPLly29XhpxsM53wZs6E5s1h/XoYMgQuuyzqRJIkSZIkSYXLpElwxBFh8NbLL0OnTlEnynM56ddyXCAWBEWqQAR48MEwbLZUKZg+HfbcM+pEkiRJkiRJhcPKlbDPPrBgQZgB+uSTUSfKFznp1xyLmQh69YJjj4UNG+DMM8OvkiRJkiRJ2nmXXBLKw4YN4YEHok5TIFkgJoJYDIYPh6pV4Ztv4MYbo04kSZIkSZKU+J57Dp5/HooVg2efhe1cXq+osUBMFDVrbhlCO3gwfPBBtHkkSZIkSZIS2S+/wMUXh+P+/aFVq2jzFGAWiInkpJPgggvCgp5nnw3Ll0edSJIkSZIkKfFkZMBZZ0FaGrRuDddfH3WiAs0CMdHcdx80agS//QYXXRTKREmSJEmSJG2/gQPh44/DlOVnnoHixaNOVKBZICaacuXCnPzixeHFF2HUqKgTSZIkSZIkJY5p08KUZYAHH4Tddos2TwKwQExELVvCLbeE41694OefI40jSZIkSZKUENasga5dYdMmOOUU6N496kQJwQIxUV13HbRpA6tXhzn7mzZFnUiSJEmSJKlgu/pqmDMHdtkFHn0UYrGoEyUEC8REVawYPP00JCfDZ5/BgAFRJ5IkSZIkSSq4Xn8dhg0LxyNHQuXK0eZJIBaIiax+fXjooXB8660wZUqkcSRJkiRJkgqkxYvhvPPC8VVXwVFHRZsnwVggJrquXeH008P24926hSnNkiRJkiRJCuJxOPdcWLoU9tkH7ror6kQJxwIx0cVi8MgjUKcO/Pgj9O4ddSJJkiRJkqSC4+GH4a23oFQpeO658KtyxAKxMKhUCUaNCmXik0/C2LFRJ5IkSZIkSYrerFlh4xSAgQNhzz2jzZOgLBALi8MPh759w3HPnrBwYaRxJEmSJEmSIpWeHpZ+W78e2rWDyy6LOlHCskAsTG6/HfbbD/74A845BzIzo04kSZIkSZIUjZtugv/9D6pUgeHDw8xN7RALxMKkZEl49lkoXRreew8efDDqRJIkSZIkSflv4kQYNCgcP/EE1KoVaZxEZ4FY2DRtCvfeG46vvRa+/TbaPJIkSZIkSflpxQo466yw+/L550OHDlEnSngWiIXRJZdA+/awYcOWuf6SJEmSJEmFXTwOF18Mv/4K//kP/Pe/UScqFCwQC6NYDJ56CqpVCyMQb7gh6kSSJEmSJEl579ln4YUXoFixcFy+fNSJCgULxMKqRo1QIgLcdx+8/360eSRJkiRJkvLSvHlw6aXh+JZb4IADokxTqFggFmYnnAAXXRSOu3cPuzNLkiRJkiQVNhkZYd3DtDQ46CC47rqoExUqFoiF3b33QuPGsHAhXHhhWAtAkiRJkiSpMLn7bvjkE6hQAZ55BooXjzpRoWKBWNiVKwfPPRf+4bz8MowcGXUiSZIkSZKk3DN1apiyDDB0KDRoEGmcwsgCsSho3hxuuy0cX3YZ/PRTtHkkSZIkSZJyw5o10K0bbNoEp50WpjEr11kgFhXXXAOHHgqrV4d/TJs2RZ1IkiRJkiRp51x1FcyZA7vuCsOGQSwWdaJCyQKxqChWDEaNgpQUmDwZ7rwz6kSSJEmSJEk77rXX4LHHQmk4ciRUqhR1okLLArEoqVcPHn44HN9+O3z+ebR5JEmSJEmSdsSiRXD++eG4Tx848sho8xRyFohFzZlnQpcuYXvzrl1h1aqoE0mSJEmSJG2/eBzOOQeWLYNmzeCOO6JOVOhZIBZFDz8MdevCzz9D795Rp5EkSZIkSdp+Dz0E77wDpUvDs89CqVJRJyr0LBCLoooVw3qIsRg89RS88krUiSRJkiRJkv7dzJnQt284HjQI9tgj2jxFhAViUXXYYXDtteG4Z0/47bdo80iSJEmSJG3Lhg1habb16+HYY+HSS6NOVGRYIBZlt94K++8Py5dDjx6QmRl1IkmSJEmSpK278Ub4+muoWhWGDw8zK5UvLBCLspIlw1oBZcrA++/DAw9EnUiSJEmSJOmfPvgABg8Ox08+CTVrRpuniLFALOqaNNnyD/C66+Dbb6PNI0mSJEmS9FcrVsDZZ4fdly+4AE46KepERY4FouCii+CEEyA9fctaApIkSZIkSVGLx0Nv8dtv0KgR3Hdf1ImKJAtEhTUDnnwSqleHGTOgX7+oE0mSJEmSJMHTT8OYMVC8eFiGrVy5qBMVSRaICqpXDwuQAtx/P7z3XqRxJEmSJElSETd3LvTqFY5vuQVatow0TlFmgagt2reHSy4Jxz16wLJlkcaRJEmSJElF1KZN0K0brFoFbdqEfRsUGQtEZTVoUNhY5fff4cILw1oDkiRJkiRJ+enuu+GzzyA5OUxjLlYs6kRFmgWisipbNqwpUKIEvPLKlmnNkiRJkiRJ+eGLL8KUZYCHHoL69aNMIywQtTX77w+33x6OL78cfvwx2jySJEmSJKloWL0aunaFjAw4/fRwrMhZIGrrrr4aDjsM1qwJaw5s3Bh1IkmSJEmSVNhdeWUYyFSnDjzyCMRiUScSFojKTrFiMGoUpKTAlClwxx1RJ5IkSZIkSYXZ2LHwxBOhNBw1CipVijqR/p8ForJXt25o+yEUiJ99Fm0eSZIkSZJUOC1cCD17huO+feHwwyONo6wsELVtXbqE9QYyM7dsny5JkiRJkpRbMjPhnHPgjz9gv/227MugAsMCUf/uoYegXj2YOzdsqiJJkiRJkpRbhg6F996D0qXh2WehZMmoE+lvLBD171JS4OmnISkJRoyAl16KOpEkSZIkSSoMZsyAa64Jx/feC02bRptHW2WBqO1zyCFw3XXh+IIL4Ndfo80jSZIkSZIS24YNYdm0DRugfXu45JKoEykbFojafrfcAi1awIoV0KNHWKNAkiRJkiRpR1x/PXzzDVSrBk89FXZfVoFkgajtV6IEPPMMlC0LEybA/fdHnUiSJEmSJCWiCRPgvvvC8VNPQY0a0ebRNlkgKmd2333LP/B+/eDrr6PNI0mSJEmSEsvy5dC9ezi+6CI44YRo8+hfWSAq5y64AE46CdLTw1oF69ZFnUiSJEmSJCWCeBwuvBB++w0aNw4bp6jAs0BUzsVi8MQTYXjxd99t2VxFkiRJkiRpW0aOhJdeguLF4bnnoFy5qBNpO1ggasdUqwbDh4fjIUPg3XejzSNJkiRJkgq2n36Cyy4Lx7fdBs2bR5tH280CUTvuuOOgV69w3KMHLFsWaRxJkiRJklRAbdoEZ50Fq1fDoYfCNddEnUg5YIGonTNwIDRtCosWQc+eYS0DSZIkSZKkv7rrLpg8GZKTYdQoKFYs6kTKAQtE7ZwyZcKaBSVKwKuvwpNPRp1IkiRJkiQVJJ9/HqYsAzz8MNSrF20e5ZgFonZes2Zw553h+Ior4IcfIo0jSZIkSZIKiFWroFs3yMiALl2ga9eoE2kHWCAqd/TpA0ccAWvXhjeDjRujTiRJkiRJkqLWu3fYPKVu3TD6UAnJAlG5IykpbMVesSJMnbplaLIkSZIkSSqaXnkFnnoKYrGw7mHFilEn0g6yQFTuqVMHhg0Lx3fdBZ9+Gm0eSZIkSZIUjYULw2arANdeC4cdFm0e7RQLROWu008P27JnZoY1DtLSok4kSZIkSZLyU2Ym9OgBy5fD/vvDrbdGnUg7yQJRuW/oUKhfH+bNg8suizqNJEmSJEnKT0OGwPjxUKYMPPsslCwZdSLtJAtE5b7kZHjmmbAu4qhRMGZM1IkkSZIkSVJ++PZbuO66cDx4MDRpEm0e5QoLROWNgw+G668PxxdeCAsWRJtHkiRJkiTlrfXr4cwzYcMGOOEEuOiiqBMpl1ggKu/07w8tW8LKldC9e1gDQZIkSZIkFU7XXw8zZkD16vDkk2H3ZRUKFojKOyVKhKnMZcvChx/CffdFnUiSJEmSJOWF8ePhv/8Nx08+GUpEFRoWiMpbjRvD/feH4+uvh6++ijKNJEmSJEnKbX/8EXZdBrj44jB9WYWKBaLy3vnnw8knw8aNYS2EdeuiTiRJkiRJknJDPA4XXAALF4YNU+69N+pEygMWiMp7sRg88QTUrAmzZsE110SdSJIkSZIk5Ybhw+GVV8IyZs8+G5YxU6Fjgaj8UbUqjBgRjocOhbffjjSOJEmSJEnaST/9BJdfHo5vvx323z/aPMozFojKP+3awWWXheNzzoGlS6PNI0mSJEmSdsymTdCtG6xZA4cdBldfHXUi5SELROWve+6BPfeExYvD2ojxeNSJJEmSJElSTt1xB3z+OaSkwKhRUKxY1ImUhywQlb/KlAlrIpQsCePGweOPR51IkiRJkiTlxOTJYcoywCOPQN260eZRnsv1AjEjI4ObbrqJBg0aUKZMGRo2bMjtt99O/C8jzeLxOP3796dWrVqUKVOGtm3b8sMPP+R2FBVU++4Ld90Vjq+8EubMiTaPJEmSJEnaPqtWhanLmZnQtSt06RJ1IuWDXC8Q77nnHh555BGGDh3KrFmzuOeeexg4cCAPPvjg5nMGDhzIkCFDGDZsGFOmTKFcuXK0a9eO9evX53YcFVRXXglHHQVr14Y3nI0bo04kSZIkSZL+zeWXw88/Q7168NBDUadRPonF47m7CN0JJ5xAjRo1ePLJJzc/1rlzZ8qUKcMzzzxDPB6ndu3a9OnTh6v/f4HN1NRUatSowYgRIzjjjDP+9XOkpaWRkpJCamoqycnJuRlf+enXX2GffWDFCujXb8uoREmSJEmSVPC8+CKcdhrEYjBpEhxySNSJtBNy0q/l+gjEgw46iAkTJjDn/6elfv3113zyySccd9xxAMydO5dFixbRtm3bzR+TkpJCq1atmDx58lZfc8OGDaSlpWW5qRDYdVd49NFwPGBAWBNRkiRJkiQVPLNmwbnnhuPrrrM8LGJyvUC87rrrOOOMM2jSpAklSpRgv/32o3fv3nTt2hWARYsWAVCjRo0sH1ejRo3Nz/3dgAEDSElJ2XyrU6dObsdWVE49FS67LBx36wazZ0ebR5IkSZIkZZWaCh06wOrVcPjhcOutUSdSPsv1AnHMmDE8++yzPPfcc3z55ZeMHDmSe++9l5EjR+7wa/br14/U1NTNtwULFuRiYkVu8OBw5WLVKujYMfwqSZIkSZKil5kJZ58dNkDddVd44QUoUSLqVMpnxXP7Bfv27bt5FCLA3nvvzS+//MKAAQPo3r07NWvWBGDx4sXUqlVr88ctXryYZs2abfU1S5UqRalSpXI7qgqKEiXCOgrNm4ch0d27w0svQVKu99uSJEmSJCkn7rwzLDlWqhS88gpUrx51IkUg1xuatWvXkvS34qdYsWJkZmYC0KBBA2rWrMmECRM2P5+WlsaUKVNo3bp1bsdRoqhRA15+GUqWhLFj4e67o04kSZIkSVLR9uabcPPN4fiRR6Bly2jzKDK5XiCeeOKJ3Hnnnbz55pvMmzePsWPHct9999GxY0cAYrEYvXv35o477mDcuHF8++23nH322dSuXZsOHTrkdhwlklatYOjQcHzjjfDOO9HmkSRJkiSpqPrhB+jaFeJxuPhiOOecqBMpQrF4PB7PzRdctWoVN910E2PHjmXJkiXUrl2bLl260L9/f0qWLAlAPB7n5ptv5rHHHmPlypW0adOGhx9+mMaNG2/X58jJNtNKQBdeCI89BhUrwrRp0LBh1IkkSZIkSSo6Vq8Og3xmzoSDDoIPPwwzBlWo5KRfy/UCMT9YIBZyGzaEXZ0+/xz23hsmT4Zy5aJOJUmSJElS4RePw2mnhb0JatWC6dPDryp0ctKvuUuFCp5SpcIbVY0a8O23cN554Q1MkiRJkiTlrYEDw8/kJUpsKRFV5FkgqmDaZZfwRlW8eNgi/r77ok4kSZIkSVLhNn48XH99OB4yJExflrBAVEHWpg3cf384vuYa+OCDSONIkiRJklRozZ0LZ5wBmZlhJuCFF0adSAWIBaIKtksuge7dwxvYaafBL79EnUiSJEmSpMJl7Vro2BGWL4eWLWHoUIjFok6lAsQCUQVbLAaPPAL77w9//AGdOsG6dVGnkiRJkiSpcIjH4YIL4OuvoVo1ePllKF066lQqYCwQVfCVKQOvvAJVq8KXX8JFF7mpiiRJkiRJueGBB+DZZ6FYMXjxRahTJ+pEKoAsEJUY6tULm6kkJcGoUfDQQ1EnkiRJkiQpsU2cCFdfHY4HD4bDDos0jgouC0QljiOPhEGDwvGVV8LHH0ebR5IkSZKkRLVgQdhrICMDunWDyy+POpEKMAtEJZYrrwy7Qm3aBKecAr/9FnUiSZIkSZISy/r1YY+BpUuhWTN49FE3TdE2WSAqscRi8MQTsM8+sGQJdO4MGzZEnUqSJEmSpMQQj8Mll8C0aVC5MowdC2XLRp1KBZwFohJPuXJhU5VKlWDKFLjssqgTSZIkSZKUGIYNg+HDwx4Do0dD/fpRJ1ICsEBUYmrYEJ57LoxIfPzxcJMkSZIkSdn79FO44opwPGAAHH10tHmUMCwQlbiOPRbuvDMc9+oFn38ebR5JkiRJkgqqhQvDXgIbN8Kpp0LfvlEnUgKxQFRiu+66sPBrenpYD3HRoqgTSZIkSZJUsKSnh/Jw0SLYay946ik3TVGOWCAqscViMGIENG0arqacemp4Y5QkSZIkScEVV8DkyVCxYtg0pXz5qBMpwVggKvFVqACvvgrJyfDJJ9CnT9SJJEmSJEkqGJ56KmycEovBs8/Cf/4TdSIlIAtEFQ6NG8PTT4fjoUNh5Mho80iSJEmSFLUvvoCLLw7Ht94K7dtHm0cJywJRhcdJJ8HNN4fjCy+E6dOjzSNJkiRJUlSWLAl7BaSnw8knww03RJ1ICcwCUYVL//5wwgmwYUPYXGXp0qgTSZIkSZKUvzZuhNNOg19/hd13h1GjIMkKSDvOrx4VLklJYSpzo0Ywfz6ccQZs2hR1KkmSJEmS8k/fvjBpUtY9A6SdYIGowufPXaXKlYMPPoDrros6kSRJkiRJ+eOZZ+CBB8LxqFHQpEm0eVQoWCCqcNpzTxgxIhwPHgyjR0caR5IkSZKkPPe//0HPnuH4hhugQ4dI46jwsEBU4XXKKVtGH557LnzzTbR5JEmSJEnKK3/8EfYCWL8ejjsu7Los5RILRBVud9wBxxwD69ZBx46wfHnUiSRJkiRJyl2bNoU9AObNg4YN4dlnoVixqFOpELFAVOFWrBg8/zw0aAA//wxdu0JGRtSpJEmSJEnKPTfcAO+/D2XLhj0BKlWKOpEKGQtEFX6VK4c30DJl4J13oH//qBNJkiRJkpQ7xoyBgQPD8fDhsPfe0eZRoWSBqKJh333hiSfC8V13wSuvRJtHkiRJkqSdNWNGWPMfoG9fOO20aPOo0LJAVNFx5plw5ZXhuHt3mDkz2jySJEmSJO2oFSvCLstr1sBRR4XBMlIesUBU0TJwIBx+OKxeHTZVSU2NOpEkSZIkSTmTmQndusFPP0G9ejB6NBQvHnUqFWIWiCpaiheHF16AOnVgzhw4++zwxitJkiRJUqK45RZ46y0oXTos0VW1atSJVMhZIKroqV49vMGWKgXjxsEdd0SdSJIkSZKk7fPaa3D77eH4scdg//2jzaMiwQJRRVOLFjBsWDi+5RZ4441I40iSJEmS9K++/x7OOiscX375lmMpj1kgqujq0QMuuQTi8bB2xA8/RJ1IkiRJkqStS0sLa/mvWgWHHgr33ht1IhUhFogq2v77Xzj44LCZSocO4Y1YkiRJkqSCJDMTuncPIxB32QXGjIESJaJOpSLEAlFFW8mS8OKLUKsWzJwJ554bRiRKkiRJklRQDBgAr74afoZ9+WWoUSPqRCpiLBClWrXCG3CJEvDSSzBwYNSJJEmSJEkK3n4bbropHD/0ELRqFW0eFUkWiBJA69bw4IPh+Prr4b33os0jSZIkSdKPP8KZZ4aZchdeCOefH3UiFVEWiNKfLrgAzjsvrC1xxhkwd27UiSRJkiRJRdXq1WHTlJUr4cAD4YEHok6kIswCUfpTLAZDh8IBB8CKFeGNeu3aqFNJkiRJkoqaeDwMcJkxA2rWDMtulSoVdSoVYRaI0l+VLh3emKtXh6+/hp493VRFkiRJkpS/Bg8OOy0XLx42/qxdO+pEKuIsEKW/23XX8EZdrBg895zDxCVJkiRJ+ef99+Haa8Px/fdDmzaRxpHAAlHausMOg/vuC8dXXw0TJ0YaR5IkSZJUBMybF9bkz8yEHj3gkkuiTiQBFohS9i67DLp1g4wMOO00WLAg6kSSJEmSpMJq3Tro1An++AOaN4dHHglr9UsFgAWilJ1YDB59FPbbD5YuDW/k69dHnUqSJEmSVNjE43DhhfC//0HVqvDKK2GNfqmAsECUtqVs2fDGXaUKTJsWho+7qYokSZIkKTcNHQpPPx3W4h8zBurWjTqRlIUFovRv6teH0aMhKQmGD4dhw6JOJEmSJEkqLD76CK68MhwPHAhHHBFtHmkrLBCl7dG2Ldx9dzi+4gr49NNo80iSJEmSEt+vv8Kpp4a197t02VIkSgWMBaK0va6+OmymsnEjnHIKLFwYdSJJkiRJUqLasAE6d4YlS2CffeCJJ9w0RQWWBaK0vWIxePJJ2GsvWLQolIjp6VGnkiRJkiQlol694IsvoFIlGDs2rMEvFVAWiFJOlC8f3tgrVoTJk8N0ZkmSJEmScuKxx7aMOHz+edhtt6gTSdtkgSjl1H/+A88+G97ohw0LoxIlSZIkSdoekyeH0YcAd90F7dpFm0faDhaI0o5o3x5uuy0cX3JJGHYuSZIkSdK2/P57WPdw48bw67XXRp1I2i4WiNKOuv56OPnksA7inwvfSpIkSZK0NenpYcfl33+HPfaA4cPdNEUJwwJR2lFJSTBqFOy+O/z665YdmiVJkiRJ+rurroJPP4Xk5LC2foUKUSeStpsForQzkpPh1VfDG/+kSdC3b9SJJEmSJEkFzYgR8NBD4fjZZ6Fx40jjSDllgSjtrCZNwkhEgAcegGeeiTaPJEmSJKngmDYNLrooHN9yC5xwQqRxpB1hgSjlhg4d4MYbw3HPnvC//0UaR5IkSZJUACxdCp06wYYNcOKJcNNNUSeSdogFopRbbrkFjjsO1q8P/0H88UfUiSRJkiRJUdm0KayVv2ABNGoETz8d1tKXEpBfuVJuKVYsrGXRsCHMmwdnnBH+w5AkSZIkFT3XXgsTJ0L58mHt/JSUqBNJO8wCUcpNlSqF/xjKloX334cbbog6kSRJkiQpvz33HNx3XzgeMQL22CPSONLOskCUcttee8Hw4eF44EAYMybaPJIkSZKk/PP113D++eG4Xz/o3DnaPFIusECU8sJpp0HfvuH43HNhxoxo80iSJEmS8t7y5dCxI6xbB+3awe23R51IyhUWiFJeuesuOOooWLMm/AeycmXUiSRJkiRJeSUjA7p0gblzoUGDMI25WLGoU0m5wgJRyivFi8Po0VCvHvz4I3TtCpmZUaeSJEmSJOWFm26C996DMmVg7FioXDnqRFKusUCU8lLVquE/jtKl4a234JZbok4kSZIkScptL78MAwaE4yefhH33jTaPlMssEKW8tt9+8Nhj4fj22+G116LNI0mSJEnKPd99B927h+OrrgrTmKVCxgJRyg9nnQWXX77l+Ouvo80jSZIkSdp5S5ZAhw5h7fsjjoB77ok6kZQnLBCl/HLvvXD44bBqFRx7LPz8c9SJJEmSJEk7atUqaN8+rHlfrx688EJYC18qhCwQpfxSokRYD3GffWDRImjXLlytkiRJkiQllvR06NQJpk8Pa9+/9x5UqxZ1KinPWCBK+aliRXjnHahfP1ylat8+XLWSJEmSJCWGzMyw5uH770O5cmHDzMaNo04l5SkLRCm/1aq15erU9OnQsSNs2BB1KkmSJEnSv4nHoXdvGD06TFd+5RVo2TLqVFKes0CUotCoUbhKVb48TJgQrl5lZkadSpIkSZK0LQMGwIMPhuORI+GYY6LNI+UTC0QpKi1ahKtVJUqExXavuCJczZIkSZIkFTxPPAE33BCO778fzjwz0jhSfsqTAvG3336jW7duVKlShTJlyrD33nszbdq0zc/H43H69+9PrVq1KFOmDG3btuWHH37IiyhSwXb00TBqVDgeOhTuuivaPJIkSZKkf3rtNbjwwnB83XVhAIhUhOR6gbhixQoOPvhgSpQowdtvv83MmTMZPHgwlSpV2nzOwIEDGTJkCMOGDWPKlCmUK1eOdu3asX79+tyOIxV8Z5wBDzwQjm+8MVzVkiRJkiQVDB9/HH5uy8yEc85x4IeKpFg8nrtzJq+77jo+/fRTPv74460+H4/HqV27Nn369OHqq68GIDU1lRo1ajBixAjOOOOMf/0caWlppKSkkJqaSnJycm7Gl6Jzww3hP6KkJHj5ZejQIepEkiRJklS0ffstHHIIpKbCCSfA2LFh8xSpEMhJv5brIxDHjRtHixYtOPXUU6levTr77bcfjz/++Obn586dy6JFi2jbtu3mx1JSUmjVqhWTJ0/e6mtu2LCBtLS0LDep0LnjDjjvvHBV64wz4KOPok4kSZIkSUXXvHnQrl0oDw8+OKxdb3moIirXC8Sff/6ZRx55hEaNGvHuu+9y8cUXc/nllzNy5EgAFi1aBECNGjWyfFyNGjU2P/d3AwYMICUlZfOtTp06uR1bil4sBsOGwUknwYYN4ddvvok6lSRJkiQVPcuWhfLw999hzz1h3DgoWzbqVFJkcr1AzMzMZP/99+euu+5iv/3244ILLqBnz54MGzZsh1+zX79+pKambr4tWLAgFxNLBUjx4jB6NLRpE65yHXtsuOolSZIkScofq1dD+/YwZw7UqQPvvAOVK0edSopUrheItWrVYo899sjyWNOmTZk/fz4ANWvWBGDx4sVZzlm8ePHm5/6uVKlSJCcnZ7lJhVaZMuHq1l57hatd7drB0qVRp5IkSZKkwi89HTp3hqlTQ2n43nuw665Rp5Iil+sF4sEHH8zs2bOzPDZnzhzq1asHQIMGDahZsyYTJkzY/HxaWhpTpkyhdevWuR1HSkyVKoWrXPXqhate7duHq2CSJEmSpLzx5y7L770Xpiu/9RY0aRJ1KqlAyPUC8corr+Tzzz/nrrvu4scff+S5557jscce49JLLwUgFovRu3dv7rjjDsaNG8e3337L2WefTe3atengrrPSFrvsAu++C1WqwLRp0KlTuBomSZIkScpd8Tj06QPPPReWlnr5ZWjVKupUUoGR6wViy5YtGTt2LM8//zx77bUXt99+O/fffz9du3bdfM4111zDZZddxgUXXEDLli1ZvXo177zzDqVLl87tOFJi2333cNWrXDkYPx569AhXxSRJkiRJuWfgQLj//nA8fHhYj17SZrF4PB6POkROpaWlkZKSQmpqqushqmh491044QTYtAmuuAL++9+wa7MkSZIkaecMHw7nnhuOBw+Gq66KNo+UT3LSr+X6CERJeaBdOxgxIhw/8ADcc0+kcSRJkiSpUHj9dejZMxz37Wt5KGXDAlFKFF27hpGHAP36wVNPRZtHkiRJkhLZZ5/BaadBRgZ07+5ADWkbLBClRNK7N1x7bTju2RPGjYs0jiRJkiQlpO++C8tErV8Pxx8Pjz/uMlHSNlggSolmwAA455ywmcrpp8Mnn0SdSJIkSZISx/z5YZmoFSvgwANhzBgoUSLqVFKBZoEoJZpYDB57bMvVshNPhBkzok4lSZIkSQXfsmWhPPztN2jaFN54A8qWjTqVVOBZIEqJqHhxeOEFOOggWLky/Af4yy9Rp5IkSZKkgmvNmjAQ4/vvYddd4d13oUqVqFNJCcECUUpUZcuGHcP23BMWLgwl4rJlUaeSJEmSpIJn40Y49VSYMgUqVw7lYZ06UaeSEoYFopTIKleGd94J//HNnh0W/12zJupUkiRJklRwZGbCuefC229DmTJh2vIee0SdSkooFohSovtz6H3lyvDFF3DKKeHqmiRJkiQJrrkGnnkGihWDF1+E1q2jTiQlHAtEqTBo2hTeeitMa37nnXB1LTMz6lSSJEmSFK1774XBg8PxU0+FWVuScswCUSosWrWCl14KG6w88wz07QvxeNSpJEmSJCkao0aFn4sABg6Es8+ONo+UwCwQpcLkuOPCVTWA++4LV9skSZIkqah5660wMwugT58tRaKkHWKBKBU2Z521pTi85hoYOTLaPJIkSZKUnz7/PKwNn5EB3bqF0YeSdooFolQY9ekDV18djs87D958M9o8kiRJkpQfZs0K6xyuWwfHHhtmaCVZfUg7y39FUmF1zz1hjY+MDDj1VPjss6gTSZIkSVLeWbAAjjkGli+HAw4Ia8SXKBF1KqlQsECUCqukJHjiCWjfPlx9O+EEmDkz6lSSJEmSlPuWLw8jDn/9FXbfPczCKlcu6lRSoWGBKBVmJUrAmDFw4IGwYgW0axeuykmSJElSYbF27ZYBE7vsAu+9B1WrRp1KKlQsEKXCrlw5eOMNaNo0XI1r1w7++CPqVJIkSZK08zZuhNNOg8mToWJFeOcdqFs36lRSoWOBKBUFVarAu+/CrruGRYVPOAHWrIk6lSRJkiTtuHgcevYM05VLlw4DJ/baK+pUUqFkgSgVFXXqhBKxUiX4/PNwlW7jxqhTSZIkSdKOue46GDkSihULSzcdfHDUiaRCywJRKkr22CNcnStTBt56C84/HzIzo04lSZIkSTlz330wcGA4fvxxOPHEaPNIhZwFolTUtG4NL74YrtKNGhWu2kmSJElSonjmGejTJxwPGADnnBNtHqkIsECUiqLjj4cnnwzHgwbB4MHR5pEkSZKk7fHOO1sKw9694dprI40jFRUWiFJR1b073HNPOL76anj66WjzSJIkSdK2TJkCnTvDpk1w5plhIEQsFnUqqUiwQJSKsr594aqrwvG558Lbb0ebR5IkSZK25vvvw0yqtWvhmGNg+HBIstKQ8ov/2qSiLBYLU5i7dQtX8U45JezQLEmSJEkFxa+/Qrt28Mcf0LIlvPwylCwZdSqpSLFAlIq6pCR46ik49thwNe/442HWrKhTSZIkSRKsWBF+Vpk/Hxo3hjffhPLlo04lFTkWiJKgRImwM/MBB8Dy5eHq3q+/Rp1KkiRJUlG2bh2ceCJ89x3Urg3vvgvVqkWdSiqSLBAlBeXLh6t5u+8OCxaEEnH58qhTSZIkSSqKNm2C00+HTz+FlJSw+3L9+lGnkoosC0RJW1StGq7q7bILzJwZrvatXRt1KkmSJElFSTwOF14Ir78OpUuHX/feO+pUUpFmgSgpq3r1wtW9ihXhs8/CVb+NG6NOJUmSJKmouOGGsE57UhKMHg2HHBJ1IqnIs0CU9E977bXlat8bb8AFF4SrgJIkSZKUlx54AAYMCMePPgonnxxtHkmABaKk7LRpA2PGQLFiMGIE9OsXdSJJkiRJhdnzz0Pv3uH4zjvh/PMjjSNpCwtESdk78UR47LFwfM898N//RptHkiRJUuH03nvQvXs4vuwyBzBIBYwFoqRtO/fcLVMIrroKnn022jySJEmSCpepU6FTp7D2+umnw/33QywWdSpJf2GBKOnfXXstXHFFOO7RI+zULEmSJEk7a84caN8e1qyBtm1h5MiweYqkAsV/lZL+XSwG990HXbrApk3QuTN88UXUqSRJkiQlsoUL4ZhjYNkyaN4cXnkFSpWKOpWkrbBAlLR9kpLCZipHHx2uDrZvD7NnR51KkiRJUiJauRKOPRZ++QX+8x946y2oUCHqVJKyYYEoafuVLAkvvwwtWsAff4Srhb/9FnUqSZIkSYlk3To46ST49luoWTNsoFK9etSpJG2DBaKknKlQIVwdbNQI5s8PVw1XrIg6lSRJkqREsGkTnHkmfPwxJCfDO+9AgwZRp5L0LywQJeVctWrhKmGtWjBjRrh6uG5d1KkkSZIkFWTxOFx8Mbz6aljrcNw42HffqFNJ2g4WiJJ2TP364WphSgp88gmccUa4mihJkiRJW9O/PzzxRFhf/bnn4LDDok4kaTtZIEracfvsE64a/nn18KKLwlVFSZIkSfqroUPhjjvC8SOPQKdO0eaRlCMWiJJ2zqGHwujR4Srik0/CjTdGnUiSJElSQTJmDFx+eTi+7Ta44IJo80jKMQtESTuvQwd49NFwfNddMGRIpHEkSZIkFRDvvw/duoWZSpde6oADKUFZIErKHeefv2VKQu/eYVSiJEmSpKJr+nTo2BE2boRTT4UHHoBYLOpUknaABaKk3HP99dCrV7i6ePbZMH581IkkSZIkReGHH+C442D1ajjySHj6aShWLOpUknaQBaKk3BOLhauKp50WrjJ27Aiffx51KkmSJEn56ddfoV07WLoU9tsPxo4NGy9KSlgWiJJyV1ISjBoFRx0Fa9ZA27bw4YdRp5IkSZKUH378Edq0gblzoWFDePttSE6OOpWknWSBKCn3lSoFr70WysM1a8LUhddfjzqVJEmSpLw0YwYccgj88gs0agQffAA1akSdSlIusECUlDfKlQul4cknw4YN0KmTG6tIkiRJhdXUqXDYYbBoEeyzD3z8MdStG3UqSbnEAlFS3ildGl58Ebp2hU2b4Mwz4fHHo04lSZIkKTdNmhQ2Slm+HFq1gokTHXkoFTIWiJLyVokSYU3Eiy4KuzNfcAHcd1/UqSRJkiTlhrfegmOPDbstH3EEjB8PlSpFnUpSLrNAlJT3kpLg4YfhmmvC/T594OabQ6EoSZIkKTGNGROWLFq/Hk48MZSJFSpEnUpSHrBAlJQ/YjG45x64665w/7bb4KqrLBElSZKkRPTUU9ClS1iqqEsXePnlsISRpELJAlFS/urXDx58MBzffz/07AkZGZFGkiRJkpQD998P550HmZnh+/mnnw5LF0kqtCwQJeW/Xr1gxIgwtfnJJ8PmKunpUaeSJEmStC3xONx+O1x5Zbjfpw88+igUKxZtLkl5zgJRUjS6dw9rppQoEX7t2BHWrYs6lSRJkqSticehb1/o3z/cv+02GDQoLFUkqdCzQJQUnc6dYdw4KFMmLLh83HGQlhZ1KkmSJEl/lZEBF14IgweH+/ffDzfdZHkoFSEWiJKideyx8O67kJwMkyZB27bwxx9Rp5IkSZIEsHEjdOsGjz++ZQmiK66IOpWkfGaBKCl6hxwCH3wAVarA1Klw+OHw++9Rp5IkSZKKtvXrw6yh0aOheHF4/nk499yoU0mKgAWipIKheXP46COoVQtmzIBDD4Vffok6lSRJklQ0rVoF7dvD669D6dLw2mtw2mlRp5IUEQtESQXHHnvAJ59Agwbw44/Qpg3Mnh11KkmSJKloWb4cjj4aPvwQypeHd94JZaKkIssCUVLBsttu8PHH0LQp/PprmN781VdRp5IkSZKKhsWL4YgjYMoUqFw5LDV02GFRp5IUMQtESQXPLruEDVX22w+WLg1rIk6eHHUqSZIkqXCbPz9cwP/mG6hZM3xP3rJl1KkkFQAWiJIKpmrVwpSJgw+G1NQwhWLChKhTSZIkSYXTnDlhCaEffoB69cKsoL32ijqVpALCAlFSwZWSAu++C8ccA2vWhHVXxo2LOpUkSZJUuHzzTRh5uGABNG4cysP//CfqVJIKEAtESQVbuXKhNOzYEdLToVMneO65qFNJkiRJhcOUKWGNwyVLoFmzUB7WqRN1KkkFjAWipIKvVCkYMwbOPhsyMqBbN3j00ahTSZIkSYntww/hqKNg5Upo3Trcr1496lSSCiALREmJoXhxGD4cLr0U4nG46CIYNCjqVJIkSVJieuMNOO64sFTQUUfBe+9BxYpRp5JUQFkgSkocSUnw4IPQr1+4f801cNNNoVCUJEmStH1Gjw5LBG3YACefHMrE8uWjTiWpALNAlJRYYjG46y4YMCDcv+MO6N0bMjMjjSVJkiQlhMcfhzPPhE2boGtXePFFKF066lSSCjgLREmJ6brr4KGHwvGQIXDeeeGbIEmSJElbd999cMEFW5YEGjUKSpSIOpWkBJDnBeLdd99NLBajd+/emx9bv349l156KVWqVKF8+fJ07tyZxYsX53UUSYXNJZeEb3qKFYMRI6BLl7BTsyRJkqQt4nG45Rbo0yfcv+YaePjhsESQJG2HPH23mDp1Ko8++ij77LNPlsevvPJKXn/9dV588UUmTZrEwoUL6dSpU15GkVRYnXVWmHZRsiS89FJYw2Xt2qhTSZIkSQVDPA5XXQW33hru33kn3H13WBpIkrZTnhWIq1evpmvXrjz++ONUqlRp8+Opqak8+eST3HfffRx55JE0b96c4cOH89lnn/H555/nVRxJhVnHjvD661CmDLzzDhx7LKSlRZ1KkiRJilZGBvTsCfffH+4PGQLXX295KCnH8qxAvPTSSzn++ONp27ZtlsenT5/Oxo0bszzepEkT6taty+TJk7f6Whs2bCAtLS3LTZKyOOYYGD8ekpPh44/hqKNg2bKoU0mSJEnRSE8Pm6U8+WSYqjx8OFx2WdSpJCWoPCkQR48ezZdffsmAP3dJ/YtFixZRsmRJKlasmOXxGjVqsGjRoq2+3oABA0hJSdl8q1OnTl7ElpToDj4YJk6EqlVh2jQ47DBYuDDqVJIkSVL+WrcuzNIZMyZskjJmDPToEXUqSQks1wvEBQsWcMUVV/Dss89SOpe2gu/Xrx+pqambbwsWLMiV15VUCO23H3z0EeyyC8ycCYccAnPnRp1KkiRJyh9paXDccfDWW2GJn3HjoHPnqFNJSnC5XiBOnz6dJUuWsP/++1O8eHGKFy/OpEmTGDJkCMWLF6dGjRqkp6ezcuXKLB+3ePFiatasudXXLFWqFMnJyVlukpStpk3DNObddoOffw4l4vffR51KkiRJylt//AFt28KkSVChArz7blgfXJJ2Uq4XiEcddRTffvstX3311eZbixYt6Nq16+bjEiVKMGHChM0fM3v2bObPn0/r1q1zO46koqpBg1Ai7rEH/PZbKBH/97+oU0mSJEl54/ff4fDDYepUqFIFPvggfA8sSbmgeG6/YIUKFdhrr72yPFauXDmqVKmy+fHzzjuPq666isqVK5OcnMxll11G69atOfDAA3M7jqSirHbtcPX12GNh+nQ44gh4882wVqIkSZJUWPzySxh5+OOPUKsWvP9+uJAuSbkkz3Zh3pb//ve/nHDCCXTu3JlDDz2UmjVr8sorr0QRRVJhV7XqlquvqalbdmuWJEmSCoPZs6FNm1Ae1q8Pn3xieSgp18Xi8Xg86hA5lZaWRkpKCqmpqa6HKGn7rF0bFo9+5x0oWRJGjw4700mSJEmJ6quvwgXypUuhSZMw8nCXXaJOJSlB5KRfi2QEoiTlu7Jl4bXXQomYng6nngrPPBN1KkmSJGnHTJ4c1jxcuhT22w8++sjyUFKesUCUVHT8OfKwRw/IyICzzoJHHok6lSRJkpQzEybA0UeHJXoOPjgs2VOtWtSpJBViFoiSipbixeHJJ+Hyy8P9Sy6Bu++ONpMkSZK0vcaNg/btYc2aMH353XehYsWoU0kq5CwQJRU9SUlw//1w443hfr9+cP31kHhLwkqSJKkoee456NQpLMnTsWMoE8uVizqVpCLAAlFS0RSLwe23wz33hPsDBsBll0FmZrS5JEmSpK159FHo1m3LUjxjxkCpUlGnklREWCBKKtquuSasgxiLwUMPwTnnwKZNUaeSJEmSthg0CC66KMyYueQSGDEiLM0jSfnEAlGSLroo7MhcrBiMGgWnnw4bNkSdSpIkSUVdPA433RQuekNYemfo0LAkjyTlI991JAngzDPh5ZfDTs2vvAInnRQWppYkSZKikJkJV1wBd9wR7g8YAHfdFWbOSFI+s0CUpD+dfDK8+SaULQvvvQft2kFqatSpJEmSVNRs2gTnnQcPPhjuP/QQXHddtJkkFWkWiJL0V23bwvjxkJICn34KRx4JS5dGnUqSJElFRXo6dOkS1jlMSoKRI8O6h5IUIQtESfq7gw6CiROhWjX48ks47DD47beoU0mSJKmwW7s2zIp56aWwtM5LL8HZZ0edSpIsECVpq5o1g48/hl13hVmz4JBD4Oefo04lSZKkwiotDY49Ft55B8qUgddfh44do04lSYAFoiRlb/fd4ZNPoGFDmDsX2rSBmTOjTiVJkqTCZtkyOOqocAE7OTmsx33MMVGnkqTNLBAlaVvq1QvfyO21F/z+Oxx6KEyfHnUqSZIkFRYLF4Ylc6ZNg6pV4cMPw4VrSSpALBAl6d/UqhXWRGzZEv74I2ys8vHHUaeSJElSops7NyyVM3Mm1K4NH30E++8fdSpJ+gcLREnaHlWqwIQJ4epwWhq0awfvvht1KkmSJCWq77/fss72bruFpXOaNo06lSRtlQWiJG2vChXg7behfXtYtw5OPBFefjnqVJIkSUo0X34ZysPffoM99gizWxo0iDqVJGXLAlGScqJMGRg7Fk49FTZuhNNOg5Ejo04lSZKkRPHpp3DEEWHjlObNYdKkMH1ZkgowC0RJyqmSJeH55+G88yAzE3r0gKFDo04lSZKkgm78+LC7clpaGIE4YULYOEWSCjgLREnaEcWKweOPQ+/e4f5ll8Ett4RCUZIkSfq7F16AE06AtWvh2GPhnXcgJSXqVJK0XSwQJWlHxWJw331w883h/q23QseOkJoabS5JkiQVHJs2wdVXwxlnQHo6dO4Mr70GZctGnUyStpsFoiTtjFgsjDx84gkoVQrGjYOWLWHGjKiTSZIkKWpLlsDRR8PgweH+NdfA6NFhSRxJSiAWiJKUG847Dz75BOrWhR9+gAMPhDFjok4lSZKkqEyZAvvvDxMnQvny8NJLcM89ULx41MkkKccsECUpt7RoAdOnw1FHwZo1cPrp0KdPmLYiSZKkoiEeh0cfhUMPhd9+g913hy++CFOXJSlBWSBKUm6qWjUsiH3tteH+ffeFaStLlkSbS5IkSXlv/Xo4/3y46KKw3mHHjqE8bNo06mSStFMsECUptxUvDnffDS+/HKarTJwYpq98/nnUySRJkpRXfvkF2rSBp56CpKQt3w8mJ0edTJJ2mgWiJOWVTp3CFecmTcL0lUMPDdNZ4vGok0mSJCk3jR8PzZuH5WyqVIF33w0zUmKxqJNJUq6wQJSkvNS0aSgRO3WCjRvDdJbzzoN166JOJkmSpJ0Vj4eRhsceC3/8saVEbNs26mSSlKssECUpr1WoEHbdu/vuMJ1l+PAwveWXX6JOJkmSpB2VlhY2RunXDzIz4dxz4ZNPoF69qJNJUq6zQJSk/BCLhWks770XprV8+WW4Qj1+fNTJJEmSlFOzZsEBB8DYsVCiRFim5oknoHTpqJNJUp6wQJSk/HTUUaE8bNEiTHM59tgwMtF1ESVJkhLDyy+H8nD2bNhlF/j4Y7jgAtc7lFSoWSBKUn6rWzd8o3neeWG6S79+YfpLWlrUySRJkpSdTZvgmmvglFNg9Wo4/PBwYbhVq6iTSVKes0CUpCiULh2muTz2GJQsGaa/HHAAzJwZdTJJkiT93dKl0K4dDBoU7vfpE5aiqV492lySlE8sECUpSj17htGIu+4apsG0ahWmxUiSJKlgmDo1rF39wQdQrhy88ALcey8ULx51MknKNxaIkhS1Aw6A6dPhiCPCdJhTTgnTYzZtijqZJElS0fbEE9CmDSxYAI0awZQpcNppUaeSpHxngShJBUH16mGH5r59w/1Bg8I0maVLo80lSZJUFG3YEDZG6dkT0tPh5JPDSMQ994w6mSRFwgJRkgqK4sVh4EAYMyZMj/nggzBdZurUqJNJkiQVHQsWwCGHwOOPh52V77wTXnkFUlKiTiZJkbFAlKSC5tRT4YsvoHHj8A1smzZh+owkSZLy1gcfwP77hwu4lSvD22/D9ddDkj86SyrafBeUpIJojz1CidihQ5g207NnuK1fH3UySZKkwiceD0vIHH00LFsG++0H06aFJWUkSRaIklRgpaSEHZnvuitMn3niCTj00DAqUZIkSblj1aqwMco110BmJnTvDp9+Cg0aRJ1MkgoMC0RJKsiSkqBfP3jnnTCNZurUMK3mgw+iTiZJkpT4Zs+GVq3gpZegRAl4+GEYPhzKlIk6mSQVKBaIkpQIjjkGpk8P5eGyZWF6zaBBYbqNJEmScm7sWGjZEmbNgtq1YdIkuPjiMPNDkpSFBaIkJYr69eGTT6BHjzC95pprwnSbVauiTiZJkpQ4MjLCxiidOoXvow49NFyobd066mSSVGBZIEpSIilTBp56Ch55JEyzeemlMO3m+++jTiZJklTwLVsGxx0HAwaE+1deCe+/DzVrRptLkgo4C0RJSjSxGFx0EXz0EeyyS5h2c8ABYRqOJEmStu7LL6FFCxg/HsqWheeeg/vuCxdlJUnbZIEoSYnqwAPDdJvDDgvTbzp1CtNxMjKiTiZJklSwDB8OBx0Ev/wC//kPfP45dOkSdSpJShgWiJKUyGrUCFfRr7oq3B8wIEzLWbYs2lySJEkFwYYNYWOUc88NxyecAFOnwt57R51MkhKKBaIkJboSJWDwYBg9OkzHGT8+TM+ZPj3qZJIkSdH59dcwU2PYsLAEzG23wWuvQcWKUSeTpIRjgShJhcXpp8OUKdCoUZiec/DBYbqOJElSUTNxIjRvHr43qlgR3nwTbroJkvwRWJJ2hO+eklSY7LVXmJZz0klhms6554YNVzZsiDqZJElS3ovHw8YobdvCkiWw775hVsZxx0WdTJISmgWiJBU2KSlhR+bbbw/TdR59NEzf+fXXqJNJkiTlndWrw8YoffqETeW6dYPPPoPddos6mSQlPAtESSqMkpLgxhvhrbegUqUwfad58zCdR5IkqbD54Qc48EB44QUoXhwefBBGjQrrQ0uSdpoFoiQVZsceC9OmQbNmYRpP27ZhWk88HnUySZKknTJt4TSOHHkk00YPDhvIffcd1KoVLpj26hVmYkiScoUFoiQVdrvtBp9+CmedFabz9OkTpvesXh11MkmSpB026quRfDjvQ54eeTWkpUGbNmG9w4MPjjqaJBU6xaMOIEnKB2XLwsiR0KoV9O4NL7zA2lnfUPbFV6FxYwDWbVxHZjwz25coV7Lc5uOcnLt+03oyMjNy5dyyJcoS+//RBBs2bWBT5qZcObdMiTIkxcI1tfSMdDZmbMyVc0sXL02xpGI5PndjxkbSM9KzPbdU8VIUTyqe43M3ZW5iw6bsN9QpWawkJYqVyPG5GZkZrN+0PttzSxQrQcliJXN8bmY8k3Ub1+XKucWTilOqeCkA4vE4azeuzZVziyUVo3Tx0pvvr0lfkyvnJsWSKFOizA6du3bjWuLZjDKOxWKULVF2h871PcL3CN8jcn6u7xFb5NZ7xPzU+fyx9g9iq9IY/emjUBJG7wXdm55BvHdvqpZJp162ryxJ2lGxeHb/IxRgaWlppKSkkJqaSnJyctRxJCmxfPYZnHIK9U//nXlPJcPTT8NJJ9Hy8ZZMWzhtqx9StWxVlvZduvn+4SMOZ9Ivk7Z6btkSZVlz/ZYfZI5/7nje+uGtbOPEb97y39CpL57KSzNfyvbc1f1Wb/6hoserPRj59chsz11y9RKqlasGwKVvXsrD0x7O9ty5V8ylfsX6APR9ry/3Tr4323NnXDyDPavvCcAtE2/h1km3ZnvuF+d/QctdWgIw6NNBXPP+Ndme+2H3Dzm8/uEAPPTFQ/R6u1e2577R5Q2Ob3w8ACO+GsE5r52T7bljThnDqXueCsCL373IaS+dlu25w08eTo9mPQB4c86bnPD8CdmeO/S4oVx6wKUATJw3kSNGHpHtuQPbDqTvwX0BmPrbVA544oBsz735sJu55fBbAPhuyXfs9che2Z57deurGXTMIADmrZxHgwcaZHvuJS0u4aHjHwJg6ZqlVL+3erbndt+3OyM6jADCD+XlB5TP9txT9jiFF099cfP92K3ZT5dr36g9b5755ub75e4ql23xcFi9w5jYY+Lm+9UGVWPZ2mVbPbdF7RZM7Tl18/3699fnl9RftnruHtX24LtLvtt8f8+H92Tm0plbPbdeSj3m9Z63+b7vEfUB3yN8j/A94k8F5T0CIAb89Yfav75vSJKyl5N+zSnMklTUHHQQfPkllCoVpvucfDLcdFPW77wlSZISxJ/fwhRPKs4zHZ+JNIskFVaOQJSkImrt2lTKXn8zPPAAAOuOa0vm8KegUuWtnu/0xJyf6/TEwOmJOT+3KE9P3JlzfY8IfI/I+bm+RwQF+j0iPR2uuw4ee4yvakKb8/75cdMvmM7+tfbP9nUlSVnlpF+zQJSkou655+D882HdOmjQAF5+GfbbL+pUkiRJwcKFcOqpYRkW4MubL6B57DGSSCKTzM2/WiBKUs44hVmStP3OPBM+/xwaNoS5c8MU51Gjok4lSZIEH38M++8fysOUFHj9dapfdRM1y9ekee3mDDt+GM1rN6dm+ZpUL5f92pWSpJ3jCERJUrBiBZx1Frz5/wu4X3IJ/Pe/ULJktLkkSVLRE4/DkCFw9dWwaRPsvTe88gr85z9AWHqgZLGSxGIx4vE46Rnpm6eWS5K2jyMQJUk5V6kSjBsHt94KsRg8/DAcfniYNiRJkpRf1qyBbt2gd+9QHp55JkyevLk8hLB+55/rmMZiMctDScpjFoiSpC2SkqB/f3jjDahYMXyzvv/+8NFHUSeTJElFwY8/QuvWYY3m4sXh/vvhmWegXLl//VBJUt6xQJQk/VP79jBtGuyzDyxeDEceGXZrTrxVLyRJUqJ4801o0QK+/RZq1IAPPoArrggzIyRJkbJAlCRtXcOGYQRi166QkRGmEXXrFqYVSZIk5ZbMTLjlFjjhBEhNDSMQv/wSDjkk6mSSpP9ngShJyl7ZsvD002ER8+LFw3Si1q3D9CJJkqSdtWIFnHhiWIMZ4NJLYeJEqF070liSpKwsECVJ2xaLwWWXwYcfQs2aYVpR8+bwyCNhxIAkSdKOePNNaNYM3noLSpeGkSNh6FAoWTLqZJKkv7FAlCRtnzZtwnSiNm0gLQ0uuSQcz5gRdTJJkpRIfv8dTjstTFmePx922w0++wzOPjvqZJKkbFggSpK2X61aYVrR0KFQoUJYI3G//eD662HduqjTSZKkgiwzE4YNg6ZN4cUXoVgx6NsXvvkmfD8hSSqwLBAlSTlTrFhYn2jWLOjUCTZtggEDYO+94f33o04nSZIKohkzwqYoF18cNkpp2RKmTYOBA6FcuajTSZL+hQWiJGnH7LILvPwyvPYa7Lor/PQTHH00nHUWLF0adTpJklQQrFsHN9wQRhh+9hmULx82Z5s8Oax/KElKCBaIkqSdc9JJMHMmXH552HDlmWegSRMYPhzi8ajTSZKkqEyYAPvsA3fdFWYsdOgQZjBcdlmY0SBJShgWiJKknVehAjzwAEyZEkYTLF8O554LRx4Jc+ZEnU6SJOWnZcuge3do2xZ+/DHMWnjlFRg7NsxakCQlnFwvEAcMGEDLli2pUKEC1atXp0OHDsyePTvLOevXr+fSSy+lSpUqlC9fns6dO7N48eLcjiJJym8tW8LUqTBoEJQtGzZc2XtvuO022LAh6nSSJCkvxeMwcmSYiTBqVJiZ0KtXmKnQsWPU6SRJOyHXC8RJkyZx6aWX8vnnnzN+/Hg2btzIMcccw5o1azafc+WVV/L666/z4osvMmnSJBYuXEinTp1yO4okKQrFi8PVV8N338Fxx0F6Otx8c1j76OOPo04nSZLywg8/hBGHPXrAH3+EqcuTJ8ODD0JyctTpJEk7KRaP5+0CVUuXLqV69epMmjSJQw89lNTUVKpVq8Zzzz3HKaecAsD3339P06ZNmTx5MgceeOC/vmZaWhopKSmkpqaS7H9GklRwxeMwZgxccQX8OdK8Z0+45x6oVCnabJIkaeelp4edlO+4I8w2KFMGbrkFrrwSSpSIOp0kaRty0q/l+RqIqampAFSuXBmA6dOns3HjRtq2bbv5nCZNmlC3bl0mT5681dfYsGEDaWlpWW6SpAQQi8Hpp4cF0y+4IDz2+OPQtCmMHu0mK5IkJbJPPgkzDG66KZSH7drBjBlwzTWWh5JUyORpgZiZmUnv3r05+OCD2WuvvQBYtGgRJUuWpGLFilnOrVGjBosWLdrq6wwYMICUlJTNtzp16uRlbElSbqtUCR59NExhbto0jEbs0gXat4e5c6NOJ0mScmLFCrjwQjjkkLC+YfXq8Nxz8PbbsNtuUaeTJOWBPC0QL730UmbMmMHo0aN36nX69etHamrq5tuCBQtyKaEkKV+1aQP/+1/YVKVUKXjnHdhzz7DpyqZNUaeTJEnbEo/DCy+Ei4GPPRYeO//8MNOgS5cw80CSVCjlWYHYq1cv3njjDT788EN23XXXzY/XrFmT9PR0Vq5cmeX8xYsXU7Nmza2+VqlSpUhOTs5ykyQlqFKlwlSnb76BI46AdevCVKcWLcIOzpIkqeCZNw9OOAHOOCPMJGjSBCZNCkuT/P9yVZKkwivXC8R4PE6vXr0YO3YsH3zwAQ0aNMjyfPPmzSlRogQTJkzY/Njs2bOZP38+rVu3zu04kqSCqnFjmDABhg8PP3h8/TW0agWXXw6rVkWdTpIkQZghMHhwmDHw1ltQsmTYJOWrr+DQQ6NOJ0nKJ7m+C/Mll1zCc889x2uvvcbuu++++fGUlBTKlCkDwMUXX8xbb73FiBEjSE5O5rLLLgPgs88+267P4S7MklTILF0KffrA00+H+7vsAkOHQocOkcaSJKlImzYtbIL2v/+F+4cdBsOGhdGHkqSEl5N+LdcLxFg2614MHz6cHj16ALB+/Xr69OnD888/z4YNG2jXrh0PP/xwtlOY/84CUZIKqfffh4sugp9+Cvc7dIAHH4S/LIUhSZLy2KpVYbmRBx+EzMywGdq998I557jOoSQVIpEWiPnBAlGSCrF16+COO2DgwDBtqkIFuPNOuOQSKFYs6nSSJBVu48bBpZfCr7+G+127wn33hZ2WJUmFSk76tTzdhVmSpBwrUyYUhv/7H7RuHUZBXH45HHRQ2HhFkiTlvt9+g86d4eSTQ3nYoAG8+y4884zloSTJAlGSVEDttRd88gk8/DAkJ8MXX8D++8O118LatVGnkySpcMjIgIcegqZN4ZVXwmj/a6+FGTPgmGOiTidJKiAsECVJBVdSElx8McyaBaecEn7IGTgwlIvvvht1OkmSEts338DBB0OvXmHEf6tW8OWXcPfdULZs1OkkSQWIBaIkqeCrXRtefBFefx3q1IG5c+HYY+HMM2Hx4qjTSZKUWNauheuug+bNYcqUsN7w0KHw6aewzz5Rp5MkFUAWiJKkxHHCCTBzJlx5ZRid+PzzYcrVE0+EXSIlSdK2vfce7L033HNP2KysU6cw0v/SS92sTJKULQtESVJiKV8+7Ab5xRew336wYgX07AmHHx5+AJIkSf+0ZEnYUbldO/j5Z9h1V3jtNXj5Zdhll6jTSZIKOAtESVJiat48lIiDB4d1mj7+GPbdF26+GdavjzqdJEkFQzwOTz0FTZrAc89BLAaXXx5G9J90UtTpJEkJwgJRkpS4iheHq64KPwQdfzxs3Ai33QbNmsGkSVGnkyQpWrNnwxFHwHnnhRH7zZqFNQ8feCCseyhJ0nayQJQkJb569cIGK2PGQM2a4Qemww8PPzAtXx51OkmS8teGDXDrrWFDlEmTwkj9QYNg6lRo2TLqdJKkBGSBKEkqHGIxOPXUsA7iRReFx/6csvXss2EKlyRJhd1HH4WRhrfcAunpcNxx8N13cPXVYeS+JEk7wAJRklS4VKwIjzwCn34Ke+4JS5dCt25w7LHw009Rp5MkKW8sXw7nnw+HHQbffw81asDo0fDmm1C/ftTpJEkJzgJRklQ4HXQQfPkl3HEHlCoF770He+0Fd98d1kqUJKkwiMfD5ihNm8KTT4bHLrggjMg//fQwQl+SpJ1kgShJKrxKloQbboBvv4Ujjwy7M/frF3Zw/vzzqNNJkrRzfv45TFHu2hWWLAkl4scfw6OPQqVKUaeTJBUiFoiSpMKvUSN4/30YORKqVAmF4kEHQa9ekJYWdTpJknJm40YYODCMrH/33TDS/rbb4H//gzZtok4nSSqELBAlSUVDLAZnnx3WherePUz5euihMFrjlVfcZEWSlBi++AJatIBrr4V16+CII+Cbb+Cmm0KRKElSHrBAlCQVLVWrwogRMGEC/Oc/sHAhdO4MHTrAggVRp5MkaevS0uCyy+DAA0NhWLkyDB8e/j9r3DjqdJKkQs4CUZJUNB15ZJjKfOONUKIEjBsHe+wBDzwAGRlRp5MkaYuxY8P/UUOHhhHzZ50VRtT36OEmKZKkfGGBKEkqukqXhttvD2tGHXwwrF4NvXuH0R3/+1/U6SRJRd2vv4YR8p06wW+/QcOGMH48jBoF1apFnU6SVIRYIEqStOee8NFHMGwYpKTAtGnQsiVcfTWsWRN1OklSUZORAUOGhHV6X3sNiheH668PI+fbto06nSSpCLJAlCQJICkJLrwQZs2C004LP7wNHhzKxREjID096oSSpMIuHoe33w4j4a+4IoyMb906jIq/804oUybqhJKkIsoCUZKkv6pVC154Ad58E+rVg19+gXPOCRuuPPCAIxIlSbkvIwNGj4b99oP27cNI+ORkeOQR+OQT2GuvqBNKkoo4C0RJkramfXv47jsYOBBq1gw7NPfuDfXrh3UTV6yIOqEkKdGtXw+PPQa77w5dusDXX0O5ctCnT9gk5aKLwgh5SZIiFovH4/GoQ+RUWloaKSkppKamkpycnO15GRkZbNy4MR+TKb+VKFGCYsWKRR1DUmG3fj2MHBnKxJ9/Do+VLx9+sLvySqhdO9p8kqTEsmpVWHf3v/+F338Pj1WpApdfDr16QeXK0eaTJBUJ29uvQSEtEOPxOIsWLWLlypX5H075rmLFitSsWZNYLBZ1FEmF3aZN8NJLMGAAfPNNeKxkSejeHa65JkxzliQpO0uXhs1Rhg6FP39W2XXXsGnX+eeH0YeSJOWTIl8g/v7776xcuZLq1atTtmxZi6VCKh6Ps3btWpYsWULFihWpVatW1JEkFRV/LnI/YEBYmwrCFLNTT4XrroNmzSKNJ0kqYObPDxtzPf44rFsXHtt9d7j2WujaNVyMkiQpnxXpAjEjI4M5c+ZQvXp1qlSpElFC5ac//viDJUuW0LhxY6czS8p/n3wCd98dNl3503HHhSLxkEPAi1iSVHTNmgX33APPPhtGsQM0bw79+kGHDuD3rpKkCOWkQCx0K/L+ueZh2bJlI06i/PLn37XrXUqKRJs28MYbYeH7Ll3CSMS334bDDtvyXOJdq5Mk7YypU6FTJ9hzz7CG7qZNcOSRMH58eK5zZ8tDSVJCKXQF4p+ctlx0+HctqUDYZx947jmYMwcuvDBMR/vsMzjxRNh33/Dcn6NPJEmFTzwO778PbdvCAQfA2LHhsQ4dYMoUmDAhPOf3rpKkBFRoC0RJkiLRsGHYWXPevLCxSoUK8O23YY2rxo3hkUfCrs6SpMIhMxNeeSWUhkcfHYrC4sXDBlszZ4Yi8YADok4pSdJOsUCUJCkv1KoV1r2aPx/uuAOqVoW5c+GSS6B+/fBcWlrUKSVJOyo9HUaMCNOUO3eGadOgTBm47DL48cfwXNOmUaeUJClXWCAmmLPOOou77rorRx/zzjvv0KxZMzIzM/MolSQpWxUrwg03wC+/wJAhULcuLF4cNlmpWxeuvx6WLIk6pSRpe61ZAw88AP/5D5xzDnz/PaSkZH2vr1cv6pSSJOUqC8QCIB6P07ZtW9q1a/eP5x5++GEqVqzIr7/+ytdff81bb73F5ZdfDsCaNWto2LAhV111VZaPmTdvHsnJyTz++OMAHHvssZQoUYJnn302738zkqStK1t2y6iUkSPDqJTUVBgwIPyg2atXmPYsSSqYVqyA228P79m9e8OCBVCzJgwcuGW0ebVqUaeUJClPWCAWALFYjOHDhzNlyhQeffTRzY/PnTuXa665hgcffJBdd92VBx98kFNPPZXy5csDUK5cOYYPH86DDz7Ixx9/DIQy8pxzzuHggw+mZ8+em1+rR48eDBkyJH9/Y5KkfypRAs4+G2bM2LIu1vr18NBDYTTL2WfDd99FnVKS9KeFC6Fv3zBqvH9/+OMP2G23sN7t3LnhueTkqFNKkpSnYvF4PB51iJxKS0sjJSWF1NRUkv/2n/X69euZO3cuDRo0oHTp0uHBeBzWrs3/oGXL5miXtZEjR9KrVy+++eYb6tevz1FHHUXFihV55ZVXyMjIoEqVKjz77LMcf/zxWT7uqquuYty4cXz99dc8/vjj3HrrrcyYMYNddtll8znz58+nXr16/PjjjzRs2DDXfosFwVb/ziUpUcTjMHFiGIk4fvyWx086Cfr1gwMPjCyaJBVpP/4YRheOHBnWOwTYZ5/w3nzKKWGjFEmSEti2+rW/Kxr/661dC/8/ai9frV4N5cpt9+ndu3dn7NixnHvuuXTq1IkZM2bw3f+PQvnmm29ITU2lRYsW//i4O++8k7feeotu3brx7rvv8thjj2UpDwHq1q1LjRo1+PjjjwtdgShJCS0WgyOOCLdp0+Duu8NunuPGhdvhh4cfVo8+OkcXpSRJO+irr8J78Ysvhh2WAdq0Ce/Fxx3ne7EkqUhyCnMB89hjjzFjxgx69+7NY489RrX/X0fll19+oVixYlSvXv0fH1OmTBkeeOABXn31VQ4//HC6deu21deuXbs2v/zyS57mlyTthBYt4KWXYOZMOPfcMN154kRo1y489+KLkJERdUpJKnzicfjoo1AQ7rcfvPBCKA+PPx4+/jjc2re3PJQkFVlFo0AsWzaMBszvW9myOY5avXp1LrzwQpo2bUqHDh02P75u3TpKlSpFLJtvWp588knKli3Lt99+S2pq6lbPKVOmDGujmMotScqZJk3gySfhp5/CQv1ly8KXX8Jpp8Eee4Tn/pxOJ0nacfE4vPFGGGF42GHwzjuQlARdusDXX295TpKkIq5oFIixWJhKnN+3HbxCWbx4cYr/bU2VqlWrsnbtWtK38gPjCy+8wBtvvMFnn31GhQoVuPLKK7f6usuXL988olGSlADq1IH//hd++SUs3F+pEsyZA+efHxbwv+++cMFKkpQzmzbBs8+GNQ1PPBE++wxKloQLLwzvs889F56TJElAUSkQC4FmzZoBMHPmzCyPL168mEsvvZQ77riDfffdlxEjRjBq1CjefvvtLOetX7+en376if322y+/IkuSckvVqnDrrTB/PgweDLVrw2+/QZ8+UK8e3HJL2BVUkrRt69fDI49A48bQrRvMmAEVKsA118C8eWFnZdcLlyTpHywQE0S1atXYf//9+eSTT7I8fsEFF9C0aVN69+4NwAEHHEDfvn254IILskxl/vzzzylVqhStW7fOz9iSpNxUvjxcdRX8/DM8/jg0agTLl4dysV698Nyvv0adUpIKntTUsDFK/fpwySUwd264OHPHHWGU9z33QK1aUaeUJKnAskBMIOeffz7PPvvs5vujRo3i/fffZ/jw4SQlbfmrvPXWW6lYsWKWqczPP/88Xbt2pewOrMsoSSpgSpUK05hnzYIxY8KC/2vWhOnOu+0G550XpuBJUlG3ZAlcf324yNKvHyxeDHXrwpAhoTi84YawPIQkSdqmWDwej0cdIqfS0tJISUkhNTWV5OTkLM+tX7+euXPn0qBBA0qXLh1Rwryxbt06dt99d1544YUcjSRctmwZu+++O9OmTaNBgwZ5mDAahfnvXJK2SzwO770HAwbApEnhsVgMOneG666D5s2jzSdJ+W3ePLj33rDp1Pr14bGmTcN7YpcuYZd7SZKKuG31a3/nCMQEUqZMGUaNGsWyZcty9HHz5s3j4YcfLpTloSSJUBa2awcTJ4aNAE48MZSKL70ELVrAMcfAhx+GxySpMPvuOzj7bPjPf+Chh0J5eMABMHZsWO/w7LMtDyVJ2gGOQFTC8+9ckrZixoywptfzz0NGRnisVaswhe/EEyHJa4iSCpHPPw+jsMeN2/LY0UeH97zDDw8XWiRJUhaOQJQkqajbay94+mn44YewYUDp0jBlCnToAHvvDaNGwcaNUaeUpB335/INRxwBrVuH8vDP5RumTt3ynOWhJEk7zQJRkqTCrEGDMI1v3ryw9ldyMsycCd27h12chw6FtWujTilJ2y8jA158MSzR8OfyDcWLwznnhPe3P5dvkCRJucYCUZKkoqBGjTC9b/788Gv16mEH0ssug/r14a67YOXKqFNKUvbS08OmKHvsAaedBl9+CWXLQu/e8PPP8NRT0KRJ1CklSSqULBAlSSpKUlLCSMR588LIxPr1YelSuOEGqFsXLr44TPtLT486qSRBZmZYfqFfP9htNzj/fJgzBypVgv79w4WQ//4X6tSJOqkkSYWaBaIkSUVRmTJhbcQffoBnnglrJq5aBcOGhSmB1atD165hKuDq1VGnlVSUbNwI48eH96g6deDAA+Huu+G336B2bRg8OBSHt94KVatGnVaSpCKheNQBJElShIoXD0Vhly4wYUIoDF97DRYvhueeC7dSpcJuph06wEknQbVqUaeWVNisXg3vvgtjx8Ibb0Bq6pbnKlSA9u2hY8fwPlSqVGQxJUkqqiwQJUkSJCWFkvDoo+GRR+Dzz+HVV8MP8z/+GH6gf+ONcN7BB2/5Qb5Bg6iTS0pUS5fC66+H95r33oMNG7Y8V706nHxyeK858khLQ0mSIhaLx+PxqEPkVFpaGikpKaSmppKcnJzlufXr1zN37lwaNGhA6dKlI0qoralfvz69e/emd+/eufq6/p1LUh6Kx8OupmPHhh/yp0/P+vy++24pE/fZB2KxKFJKShTz5m25OPHJJ2GNwz81bLjl/eTAA6FYsYhCSpJUNGyrX/s7C8RtmLZwGteMv4aBRw+kRe0WO/VaO6NHjx6sXLmSV199NVde7/DDD6dZs2bcf//9ufJ622vp0qWUK1eOsmXLbtf5EydO5IgjjmDFihVUrFgx2/MsECUpH82fH374f/VV+OgjyMjY8lyDBuEH/44d4aCD/OFfUrgI8e23Wy5CfPVV1uf333/L+8aee3oRQpKkfJSTAtEpzNsw6utRfDjvQ57++ulIC8Tckp6eTsmSJSP7/NVcM0uSEl/dunD55eH2xx9hWvPYsWHtsrlzw26o//1vWCfxpJNCMdC2LXiBRyo6MjJg8uQtpeHPP295LikJDj00vDd06AD16kUUUpIk5YS7MP/NLyt/YfrC6Xz5+5e88N0LAIz+bjRf/v4l0xdO55eVv+TZ537ppZfYe++9KVOmDFWqVKFt27b07duXkSNH8tprrxGLxYjFYkycOBGAa6+9lsaNG1O2bFl22203brrpJjZu3Lj59W655RaaNWvGE088sXl0Xo8ePZg0aRIPPPDA5tebN2/eNnNNnDiRWCzGm2++yT777EPp0qU58MADmTFjRpbzXn75Zfbcc09KlSpF/fr1GTx4cJbn69evn2XUYywW44knnqBjx46ULVuWRo0aMW7cOADmzZvHEUccAUClSpWIxWL06NFjx/5gJUl5o0oV6N49FATLlsErr8DZZ0OlSmFtsyefhBNPDLuknnpq2JBl5cqoU0vKC+vXw5tvQs+eYafkQw6B++4L5WHp0uGCwvDhYYOmDz+EK66wPJQkKYE4AvFv6j9Qf/NxjDCFYumapTR/rPnmx+M35/6s799//50uXbowcOBAOnbsyKpVq/j44485++yzmT9/PmlpaQwfPhyAypUrA1ChQgVGjBhB7dq1+fbbb+nZsycVKlTgmmuu2fy6P/74Iy+//DKvvPIKxYoVo169esyZM4e99tqL2267Ddj+kYF9+/blgQceoGbNmlx//fWceOKJzJkzhxIlSjB9+nROO+00brnlFk4//XQ+++wzLrnkEqpUqbLN4u/WW29l4MCBDBo0iAcffJCuXbvyyy+/UKdOHV5++WU6d+7M7NmzSU5OpkyZMjv4pytJynPlyoUpiB07wsaNYXrzn1Odf/017O780ktQogQccUQYeXTyyaFokJSYUlPhrbfCSMO33w47Kf+pYkU44YTwntCuXXiPkCRJCcsC8W+e6fgMPV7rwabMTcQJReGfvxZPKs6Ik0fkyef9/fff2bRpE506daLe/1+N3XvvvQEoU6YMGzZsoGbNmlk+5sYbb9x8XL9+fa6++mpGjx6dpUBMT09n1KhRWUrCkiVLUrZs2X+83r+5+eabOfroowEYOXIku+66K2PHjuW0007jvvvu46ijjuKmm24CoHHjxsycOZNBgwZts0Ds0aMHXbp0AeCuu+5iyJAhfPHFFxx77LGbi9Lq1atvcw1ESVIBU6IEHHVUuA0ZEjZe+XMq48yZYbfV996DSy6BVq22FI+NG0edXNK/+f13eO218O/5gw/CBYM/7bLLlqnJhx0W3gskSVKhYIH4N1336UrTak2zjDj805Tzp7B/rf3z5PPuu+++HHXUUey99960a9eOY445hlNOOYVKlSpl+zEvvPACQ4YM4aeffmL16tVs2rTpH4te1qtXL9fWHmzduvXm48qVK7P77rsza9YsAGbNmsXJJ5+c5fyDDz6Y+++/n4yMDIpls5D+Pvvss/m4XLlyJCcns2TJklzJK0kqAGIxaNEi3O68E+bM2VImfv45TJkSbtddB02bbtmBtUULN1OQCooffgj/bseODf9u/6pJky0XAZo3D2scSpKkQsf/4bch6f//eJLy4Y+pWLFijB8/nrfffps99tiDBx98kN133525c+du9fzJkyfTtWtX2rdvzxtvvMH//vc/brjhBtLT07OcV66ATxcp8bcr07FYjMzMzIjSSJLyXOPGcO21YYOF336DRx6BY46B4sVh1iy46y444ICwWUuvXjBhQtYRTpLyXjwO06bBjTeGnZH//Hf7Z3nYqhUMGBD+zf7577ZlS8tDSZIKMUcgbkX1ctWpWb4mdZLrcN5+5/Hk/55kQdoCqpernqefNxaLcfDBB3PwwQfTv39/6tWrx9ixYylZsiQZGRlZzv3ss8+oV68eN9xww+bHfvll+zZ42drrbY/PP/+cunXrArBixQrmzJlD06ZNAWjatCmffvpplvM//fRTGjdunO3ow+3JCexQVklSAqhdGy66KNxWrgxrqb36avj111/hoYfCrVKlsJZahw6upSbllY0b4eOPt4wQ/vXXLc8VLx7WLu3YMWyGsssukcWUJEnRsEDcil2Td2XeFfMoWawksViMC5pfQHpGOqWKl8qzzzllyhQmTJjAMcccQ/Xq1ZkyZQpLly6ladOmrF+/nnfffZfZs2dTpUoVUlJSaNSoEfPnz2f06NG0bNmSN998k7Fjx27X56pfvz5Tpkxh3rx5lC9fnsqVK5O0HVeMb7vtNqpUqUKNGjW44YYbqFq1Kh06dACgT58+tGzZkttvv53TTz+dyZMnM3ToUB5++OEd/jOpV68esViMN954g/bt21OmTBnKly+/w68nSSrAKlaEM88Mt/Xrw8jDsWNh3Liwo/PTT4db6dJhxGLHjmGH5ypVok4uJa61a8N6pGPHwuuvw4oVW54rVw6OOy4U98cfH/6NSpKkIst5BtkoVbwUsf9feykWi+VpeQiQnJzMRx99RPv27WncuDE33ngjgwcP5rjjjqNnz57svvvutGjRgmrVqvHpp59y0kknceWVV9KrVy+aNWvGZ599tnkDk39z9dVXU6xYMfbYYw+qVavG/Pnzt+vj7r77bq644gqaN2/OokWLeP311zePEtx///0ZM2YMo0ePZq+99qJ///7cdttt29xA5d/ssssu3HrrrVx33XXUqFGDXr167fBrSZISSOnSobB44omwYcNHH8GVV0L9+qFcHDcOzjkHatQIo6KGDIHtHIUvFXl//AEjR4YSvmrV8OuoUaE8rFoVzj03lIlLl8KLL0LXrpaHkiSJWDwej0cdIqfS0tJISUkhNTX1H5uGrF+/nrlz59KgQQNKly4dUcLCZeLEiRxxxBGsWLGiQO6G7N+5JBUR8Th8802YXjl2LHz9ddbn998/jJbq2DGs2+YmLFIwf37YOXns2FDI/3V5mHr1tmyCctBBYbqyJEkqErbVr/2d3yFIkqTEEIvBvvuG2803w9y5oUx89VX45BP48stw698fGjbcUooceKCbO6hoicdh5swt6xlOn571+X322bLj+b77WrZLkqR/ZYEoLrroIp555pmtPtetWzfOOOOMfE4kSdJ2aNAgTG2+8kpYsiRMu3z1VRg/Hn76Ce69N9xq1ICTTw5lyZFHQqm8XZZEikRmJkyZsqU0/OGHLc/FYtCmTfg30KED7LZbRCElSVKicgqzWLJkCWlpaVt9Ljk5merV83b36Z3l37kkKYtVq+Ddd0OR8uabkJq65bkKFaB9+zD6ql0713ZTYlu3DiZNCoXha6/BokVbnitZEo4+OhSGJ50EBfz7OUmSlP+cwqwcqV69eoEvCSVJ2m4VKsApp4RbejpMnLhlqvPvv8MLL4QbQO3a0KQJNG0afv3ztssuTutUwbFsGXz/fbjNmrXleO7cMF35T8nJYQOijh3h2GPDvwVJkqRcYIEoSZIKr5Il4Zhjwm3oUJg6NYxMHDsW5syBhQvD7YMPsn5c+fJbysS/lov/+U94TSm3ZWSE3cT/XhLOmhV2Ts5OrVphhGHHjmFXcr8+JUlSHrBAlCRJRUNSErRqFW533w0rV8Ls2f8sa376CVavhmnTwu2vihULG7RsrVx0OrS2x9q14evuz6+5P7/u5syBDRuy/7h69bb+dVe9uqNlJUlSnrNAlCRJRVPFilsKxb9KTw8l4t9Hgn3/fVhfcc6ccBs3LuvH1ajxz6nQTZvCrru6C3RRE4+HjX22Nu34l1+y/7hSpaBx43+WhI0bQ7ly+ZdfkiTpbywQJUmS/qpkyVDeNG0apoX+KR4P0523Viz+9hssXhxuEydmfb2yZWH33f9ZCjVqBG7+ldg2bQrrEG7ta2LFiuw/rnLlLV8Lf/2aqF8/jHKVJEkqYCwQJUmStkcsFjZX2WUXOOqorM+lpW2ZlvrXIumHH8KU1f/9L9z+KikJGjTY+rTUKlXy7/elf7d69T+nu//595uevvWPicVCIfj3v9umTaFq1XyNL0mStLMsEIuA+vXr07t3b3r37h3J5z/88MNp1qwZ999/fySfX5KkPJecDC1bhttfbdwIP//8z6mss2aF0vGnn8LtzTezfly1av+cCt2kSVgHz+nQeSMeD7t0/31twu+/h19/zf7jypTZMsL0r39fjRqF5yRJkgoBC8RCZMSIEfTu3ZuVK1dmeXzq1KmUc90cSZLyX4kSoVzafXc4+eQtj8fjYbrz30e0zZoFCxbA0qXh9vHHWV+vdOmwHt7fR7Q1bmxZtb02btyyxuXfR4ympWX/cdWrb73UrVvXUleSJBV6kRaIDz30EIMGDWLRokXsu+++PPjggxxwwAFRRiqUqlWrttOvsXHjRkqUKJELaSRJErEY1KwZbkcckfW51avDJi1/LxfnzIH16+Gbb8Lt76/35y69f9/IpVq1orlLb2rq1qcd//hjWLtwa5KSYLfd/lkS7r6708olSVKRFlmB+MILL3DVVVcxbNgwWrVqxf3330+7du2YPXs21atXz5PPuSZ9TbbPFUsqRunipbfr3KRYEmVKlNnmueVK5nzE3zvvvMMdd9zBjBkzKFasGK1bt+aBBx6gYcOGzJs3jwYNGvDyyy/z4IMPMmXKFBo1asSwYcNo3bo1EydO5JxzzgEg9v8/JNx8883ccsst/5jC/P3333P++eczbdo0dtttN4YMGcLRRx/N2LFj6dChw+bPNXr0aB5++GGmTJnCsGHDOPHEE+nVqxcfffQRK1asoGHDhlx//fV06dJly5/FmjVcfPHFvPLKK1SoUIGrr746x38OkiQVaeXLw/77h9tfbdoE8+b9c9TcrFlhw45588LtnXeyflzlytCwYdgcpijIyAg7Hf/+e/bnlC279bUnGzUKOyFLkiQpi8gKxPvuu4+ePXtuLr2GDRvGm2++yVNPPcV1112X5dwNGzawYcOGzffTtjW9ZBvKDyif7XPtG7XnzTO3rD9U/d7qrN24dqvnHlbvMCb2mLj5fv0H6rNs7bIs58Rvjuc435o1a7jqqqvYZ599WL16Nf3796djx4589dVXm8+54YYbuPfee2nUqBE33HADXbp04ccff+Sggw7i/vvvp3///syePTv8fsv/8/ebkZFBhw4dqFu3LlOmTGHVqlX06dNnq3muu+46Bg8ezH777Ufp0qVZv349zZs359prryU5OZk333yTs846i4YNG24eOdq3b18mTZrEa6+9RvXq1bn++uv58ssvadasWY7/PCRJ0l8ULw7/+U+4nXDClsfj8TDdeWtTcufNg+XLw60oqllz65uY7LKL044lSZJyIJICMT09nenTp9OvX7/NjyUlJdG2bVsmT578j/MHDBjArbfemp8RI9G5c+cs95966imqVavGzJkzN5eBV199NccffzwAt956K3vuuSc//vgjTZo0ISUlhVgsRs2aNbP9HOPHj+enn35i4sSJm8+78847Ofroo/9xbu/evenUqVOWx/46ovCyyy7j3XffZcyYMRxwwAGsXr2aJ598kmeeeYaj/n93ypEjR7LrrrvuwJ+GJEnaLrFYWJ+venU49NCsz61dG6Y+z5sHmZmRxItE7dqhLKxYMeokkiRJhUIkBeKyZcvIyMigRo0aWR6vUaMG33///T/O79evH1ddddXm+2lpadSpUyfHn3d1v9XZPlcsqViW+0uuXpLtuUmxrFes510xL8dZtuaHH36gf//+TJkyhWXLlpH5/9/oz58/nz322AOAffbZZ/P5tWrVClmXLKFJkybb9Tlmz55NnTp1spSM2a072aJFiyz3MzIyuOuuuxgzZgy//fYb6enpbNiwgbJlywLw008/kZ6eTqtWrTZ/TOXKldl99923K5skScplZctCs2bhJkmSJO2ghNiFuVSpUpTKhfVocrIuYV6duy0nnngi9erV4/HHH6d27dpkZmay1157kZ6evvmcv25k8udah5l5NKLg7zs3Dxo0iAceeID777+fvffem3LlytG7d+8s+SRJkiRJklS4RLL4S9WqVSlWrBiLFy/O8vjixYu3Of22MPvjjz+YPXs2N954I0cddRRNmzZlxYoVOXqNkiVLkpGRsc1zdt99dxYsWJDlz37q1Knb9fqffvopJ598Mt26dWPfffdlt912Y86cOZufb9iwISVKlGDKlCmbH1uxYkWWcyRJkiRJkpRYIikQS5YsSfPmzZkwYcLmxzIzM5kwYQKtW7eOIlLkKlWqRJUqVXjsscf48ccf+eCDD7JM294e9evXZ/Xq1UyYMIFly5axdu0/N4E5+uijadiwId27d+ebb77h008/5cYbbwS2jGjMTqNGjRg/fjyfffYZs2bN4sILL8xSRJYvX57zzjuPvn378sEHHzBjxgx69OhBkouUS5IkSZIkJazImp2rrrqKxx9/nJEjRzJr1iwuvvhi1qxZs3lX5qImKSmJ0aNHM336dPbaay+uvPJKBg0alKPXOOigg7jooos4/fTTqVatGgMHDvzHOcWKFePVV19l9erVtGzZkvPPP58bbrgBgNKlS2/z9W+88Ub2339/2rVrx+GHH07NmjXp0KFDlnMGDRrEIYccwoknnkjbtm1p06YNzZs3z9HvQ5IkSZIkSQVHLB6Px6P65EOHDmXQoEEsWrSIZs2aMWTIkCwbcGQnLS2NlJQUUlNTSU5OzvLc+vXrmTt3Lg0aNPjXQkzBp59+Sps2bfjxxx9p2LBh1HFyzL9zSZIkSZKknNlWv/Z3kW6i0qtXL3r16hVlhCJp7NixlC9fnkaNGvHjjz9yxRVXcPDBBydkeShJkiRJkqS8lRC7MCt3rVq1imuvvZb58+dTtWpV2rZty+DBg6OOJUmSJEmSpALIArEIOvvsszn77LOjjiFJkiRJkqQE4Pa4kiRJkiRJkrJVaAvEzMzMqCMon/h3LUmSJEmSlHcK3RTmkiVLkpSUxMKFC6lWrRolS5YkFotFHUt5IB6Pk56eztKlS0lKSqJkyZJRR5IkSZIkSSp0Cl2BmJSURIMGDfj9999ZuHBh1HGUD8qWLUvdunVJSiq0A2olSZIkSZIiU+gKRAijEOvWrcumTZvIyMiIOo7yULFixShevLijTCVJkiRJkvJIoSwQAWKxGCVKlKBEiRJRR5EkSZIkSZISlnM+JUmSJEmSJGXLAlGSJEmSJElStiwQJUmSJEmSJGUrIddAjMfjAKSlpUWcRJIkSZIkSUo8f/Zqf/Zs25KQBeKqVasAqFOnTsRJJEmSJEmSpMS1atUqUlJStnlOLL49NWMBk5mZycKFC6lQoQKxWCzqOLkuLS2NOnXqsGDBApKTk6OOowTg14xyyq8Z5ZRfM8opv2aUU37NKKf8mlFO+TWjnCrsXzPxeJxVq1ZRu3ZtkpK2vcphQo5ATEpKYtddd406Rp5LTk4ulF+gyjt+zSin/JpRTvk1o5zya0Y55deMcsqvGeWUXzPKqcL8NfNvIw//5CYqkiRJkiRJkrJlgShJkiRJkiQpWxaIBVCpUqW4+eabKVWqVNRRlCD8mlFO+TWjnPJrRjnl14xyyq8Z5ZRfM8opv2aUU37NbJGQm6hIkiRJkiRJyh+OQJQkSZIkSZKULQtESZIkSZIkSdmyQJQkSZIkSZKULQtESZIkSZIkSdmyQJQkSZIkSZKULQvEiNx5550cdNBBlC1blooVK271nPnz53P88cdTtmxZqlevTt++fdm0adM2X3f58uV07dqV5ORkKlasyHnnncfq1avz4HegKE2cOJFYLLbV29SpU7P9uMMPP/wf51900UX5mFxRql+//j/+/u++++5tfsz69eu59NJLqVKlCuXLl6dz584sXrw4nxIrSvPmzeO8886jQYMGlClThoYNG3LzzTeTnp6+zY/zfaZoeeihh6hfvz6lS5emVatWfPHFF9s8/8UXX6RJkyaULl2avffem7feeiufkipqAwYMoGXLllSoUIHq1avToUMHZs+evc2PGTFixD/eT0qXLp1PiRW1W2655R9//02aNNnmx/geU7Rt7XvdWCzGpZdeutXzfY8pej766CNOPPFEateuTSwW49VXX83yfDwep3///tSqVYsyZcrQtm1bfvjhh3993Zx+P5SoLBAjkp6ezqmnnsrFF1+81eczMjI4/vjjSU9P57PPPmPkyJGMGDGC/v37b/N1u3btynfffcf48eN54403+Oijj7jgggvy4regCB100EH8/vvvWW7nn38+DRo0oEWLFtv82J49e2b5uIEDB+ZTahUEt912W5a//8v+r737j4m6/uMA/pS4w8qAkJODihtoXiZCxObtaOkMJqJbUs2Mmpq5MkOTZE1pawxbacpki7W0zc4/bBVumbV+MERhU/CmeExBZMFO2CEHy3b4O37c6/tH4zNP7gMdX70D7vnYbvPen9f7c+8b7z19874Pn9u0acT6Dz74AL/88gsOHTqEmpoaXL58GS+//LKfRkuBdPHiRbjdbuzbtw9NTU0oLS3F3r178dFHH43alzkTHH744Qds2bIFRUVFOHv2LFJSUpCVlYWenh6v9bW1tcjNzcW6detgs9mQk5ODnJwcNDY2+nnkFAg1NTXIy8vDqVOnUFlZif7+fixevBg3btwYsV94eLhHnrS3t/tpxDQezJ071+Pnf+LECdVaZgydPn3aY75UVlYCAFasWKHahxkTXG7cuIGUlBR8+eWXXo/v2rULX3zxBfbu3Qur1YqHH34YWVlZuH37tuo5fV0PTWhCAWWxWCQiImJY+2+//SYhISHidDqVtq+++krCw8Pln3/+8XquCxcuCAA5ffq00vb777/LlClTpLOz856PncaPvr4+0el0sn379hHrFi5cKJs3b/bPoGjcMRgMUlpa+p/rXS6XaDQaOXTokNLW3NwsAKSuru4+jJDGu127dklCQsKINcyZ4DF//nzJy8tTng8ODkpcXJzs2LHDa/2rr74qy5Yt82gzmUyyfv36+zpOGp96enoEgNTU1KjWqK2TKTgUFRVJSkrKf65nxtDdNm/eLDNnzhS32+31ODMmuAGQw4cPK8/dbrfo9XrZvXu30uZyuSQsLEy+++471fP4uh6ayHgF4jhVV1eHefPmISYmRmnLysrC1atX0dTUpNonMjLS4wq0zMxMhISEwGq13vcxU+D8/PPPuHLlCtauXTtq7bfffovo6GgkJSWhsLAQN2/e9MMIabzYuXMnpk+fjtTUVOzevXvE2yLU19ejv78fmZmZSttTTz2F+Ph41NXV+WO4NM709vYiKipq1DrmzOTX19eH+vp6j3wICQlBZmamaj7U1dV51AP/rm2YJ8Gpt7cXAEbNlOvXr8NgMOCJJ57A8uXLVdfBNDn9+eefiIuLQ2JiIt544w10dHSo1jJj6E59fX04ePAg3nrrLUyZMkW1jhlDQ+x2O5xOp0eOREREwGQyqebIWNZDE1looAdA3jmdTo/NQwDKc6fTqdpnxowZHm2hoaGIiopS7UOTw/79+5GVlYXHH398xLrXX38dBoMBcXFxOHfuHLZu3YqWlhb8+OOPfhopBdL777+PZ599FlFRUaitrUVhYSG6urqwZ88er/VOpxNarXbYfVpjYmKYKUGotbUVZWVlKCkpGbGOORMc/vrrLwwODnpdq1y8eNFrH7W1DfMk+LjdbuTn5+O5555DUlKSap3RaMQ333yD5ORk9Pb2oqSkBOnp6Whqahp1zUMTn8lkwoEDB2A0GtHV1YXi4mI8//zzaGxsxCOPPDKsnhlDd/rpp5/gcrnw5ptvqtYwY+hOQ1nhS46MZT00kXED8R7atm0bPv/88xFrmpubR735LwWvscwhh8OBiooKlJeXj3r+O++HOW/ePMTGxiIjIwNtbW2YOXPm2AdOAePLnNmyZYvSlpycDK1Wi/Xr12PHjh0ICwu730OlcWIsOdPZ2YklS5ZgxYoVePvtt0fsy5whotHk5eWhsbFxxPvZAYDZbIbZbFaep6enY86cOdi3bx8++eST+z1MCrDs7Gzl38nJyTCZTDAYDCgvL8e6desCODKaCPbv34/s7GzExcWp1jBjiHzDDcR7qKCgYMRPOAAgMTHxP51Lr9cP++aeoW8+1ev1qn3uvlHnwMAA/v77b9U+NL6MZQ5ZLBZMnz4dL774os+vZzKZAPx7ZRF/sZ+Y/p/cMZlMGBgYwKVLl2A0Gocd1+v16Ovrg8vl8rgKsbu7m5kygfk6Zy5fvoxFixYhPT0dX3/9tc+vx5yZnKKjo/HAAw8M+1b2kfJBr9f7VE+T08aNG5Uv+vP1Ch+NRoPU1FS0trbep9HReBYZGYnZs2er/vyZMTSkvb0dR48e9fmvH5gxwW0oK7q7uxEbG6u0d3d345lnnvHaZyzroYmMG4j3kE6ng06nuyfnMpvN+PTTT9HT06P8WXJlZSXCw8Px9NNPq/ZxuVyor69HWloaAODYsWNwu93KL3A0vvk6h0QEFosFq1evhkaj8fn1GhoaAMAjIGli+X9yp6GhASEhIcNufTAkLS0NGo0GVVVVeOWVVwAALS0t6Ojo8Pi0liYWX+ZMZ2cnFi1ahLS0NFgsFoSE+H7rZObM5KTVapGWloaqqirk5OQA+PfPUquqqrBx40avfcxmM6qqqpCfn6+0VVZWMk+ChIhg06ZNOHz4MKqrq5GQkODzOQYHB3H+/HksXbr0PoyQxrvr16+jra0Nq1at8nqcGUNDLBYLZsyYgWXLlvnUjxkT3BISEqDX61FVVaVsGF69ehVWqxUbNmzw2mcs66EJLdDf4hKs2tvbxWazSXFxsUybNk1sNpvYbDa5du2aiIgMDAxIUlKSLF68WBoaGuSPP/4QnU4nhYWFyjmsVqsYjUZxOBxK25IlSyQ1NVWsVqucOHFCnnzyScnNzfX7+yP/OHr0qACQ5ubmYcccDocYjUaxWq0iItLa2irbt2+XM2fOiN1ulyNHjkhiYqIsWLDA38OmAKitrZXS0lJpaGiQtrY2OXjwoOh0Olm9erVSc/ecERF59913JT4+Xo4dOyZnzpwRs9ksZrM5EG+B/MzhcMisWbMkIyNDHA6HdHV1KY87a5gzwev777+XsLAwOXDggFy4cEHeeecdiYyMFKfTKSIiq1atkm3btin1J0+elNDQUCkpKZHm5mYpKioSjUYj58+fD9RbID/asGGDRERESHV1tUee3Lx5U6m5e84UFxdLRUWFtLW1SX19vbz22msydepUaWpqCsRbID8rKCiQ6upqsdvtcvLkScnMzJTo6Gjp6ekREWYMeTc4OCjx8fGydevWYceYMXTt2jVl7wWA7NmzR2w2m7S3t4uIyM6dOyUyMlKOHDki586dk+XLl0tCQoLcunVLOccLL7wgZWVlyvPR1kOTCTcQA2TNmjUCYNjj+PHjSs2lS5ckOztbHnzwQYmOjpaCggLp7+9Xjh8/flwAiN1uV9quXLkiubm5Mm3aNAkPD5e1a9cqm5I0+eTm5kp6errXY3a73WNOdXR0yIIFCyQqKkrCwsJk1qxZ8uGHH0pvb68fR0yBUl9fLyaTSSIiImTq1KkyZ84c+eyzz+T27dtKzd1zRkTk1q1b8t5778mjjz4qDz30kLz00kseG0g0eVksFq//T9352SNzhsrKyiQ+Pl60Wq3Mnz9fTp06pRxbuHChrFmzxqO+vLxcZs+eLVqtVubOnSu//vqrn0dMgaKWJxaLRam5e87k5+cr8ysmJkaWLl0qZ8+e9f/gKSBWrlwpsbGxotVq5bHHHpOVK1dKa2urcpwZQ95UVFQIAGlpaRl2jBlDQ3sodz+G5oXb7ZaPP/5YYmJiJCwsTDIyMobNJYPBIEVFRR5tI62HJpMpIiJ+udSRiIiIiIiIiIiIJhzfb2ZEREREREREREREQYMbiERERERERERERKSKG4hERERERERERESkihuIREREREREREREpIobiERERERERERERKSKG4hERERERERERESkihuIREREREREREREpIobiERERERERERERKSKG4hERERERERERESkihuIREREREREREREpIobiERERERERERERKTqf4rAyDvlI8BrAAAAAElFTkSuQmCC", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "plt.figure(figsize=(16, 6))\n", + "plt.plot(X, Y, 'r', label='Y(X)')\n", + "plt.plot(start_point, func(start_point), '*g', label='start_point')\n", + "\n", + "next_point_1 = start_point - grad\n", + "plt.plot([start_point, next_point_1], func(np.array([start_point, next_point_1])), '--g', label='antigrad')\n", + "plt.legend();" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "cJ9vM4-Jayqf" + }, + "source": [ + "Поэтому чтобы не перескакивать минимальное состояние функции мы можем делать шаг в сторону антиградиента не полностью, а только на какую-то долю, для этого нужно ввести значения **шага обучения** (скорость обучения, learning rate) - это значения, замедляющее шаги градиентного спуска, чтобы не пропустить локальный минимум. " + ] + }, + { + "cell_type": "code", + "execution_count": 25, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 374 + }, + "id": "cLP5hwpIbSE7", + "outputId": "a51ce935-f8b2-44e6-aab8-58aca85e0cf1" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "# размер шага (learning rate)\n", + "learning_rate = 0.1\n", + "\n", + "plt.figure(figsize=(16, 6))\n", + "plt.plot(X, Y, 'r', label='Y(X)')\n", + "plt.plot(start_point, func(start_point), '*g', label='start_point')\n", + "\n", + "next_point_1 = start_point - grad * learning_rate\n", + "plt.plot([start_point, next_point_1], func(np.array([start_point, next_point_1])), '--*g', label='antigrad')\n", + "plt.legend();" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "M5G3YV2Ydjnz" + }, + "source": [ + "Вот мы и получили новую точку с координатой $x=4$. \n", + "\n", + "Теперь в этой точке можем снова рассчитать значение градиента." + ] + }, + { + "cell_type": "code", + "execution_count": 26, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "HqqfwmXcd4x3", + "outputId": "03ffbec2-eb25-4291-cdaa-a157ccedf213" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "4.0" + ] + }, + "execution_count": 26, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "curr_point = next_point_1\n", + "curr_point" + ] + }, + { + "cell_type": "code", + "execution_count": 27, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "hqaso7MFdxU3", + "outputId": "34dc4db0-d0c0-416f-f34c-53322b3ef533" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "8.0" + ] + }, + "execution_count": 27, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "grad = gr_func(curr_point)\n", + "grad" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "-AImpol6dxU5" + }, + "source": [ + "Отрисуем направление градиента, который показывает наискорейший рост функции.\n", + "\n", + "А синим пометим уже пройденный шаг." + ] + }, + { + "cell_type": "code", + "execution_count": 28, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 374 + }, + "id": "3pn7Qfh0dxU5", + "outputId": "b6afae12-cb1a-4025-dabf-864a3a6d8f33" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "plt.figure(figsize=(16, 6))\n", + "plt.plot(X, Y, 'r', label='Y(X)')\n", + "plt.plot(start_point, func(start_point), '*g', label='start_point')\n", + "plt.plot([start_point, next_point_1], func(np.array([start_point, next_point_1])), '--*b', label='prev step')\n", + "\n", + "next_point_2 = curr_point + grad\n", + "\n", + "plt.plot([curr_point, next_point_2], func(np.array([curr_point, next_point_2])), '--g', label='grad')\n", + "plt.legend();" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "Nq_9K48ldxU6" + }, + "source": [ + "Но если будем двигаться по этому вектору, то к минимуму функции не придем, поэтому нужно идти в противоположном направлении, а значит брать **антиградиент**.\n", + "\n", + "Но при этом помним, что если сходить на полный антиградиент, то можем перелететь минимум, поэтому домножим на скорость обучения." + ] + }, + { + "cell_type": "code", + "execution_count": 29, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 374 + }, + "id": "HiHId2wFdxU6", + "outputId": "4d367980-22ef-4f26-9810-eae64c919b01" + }, + "outputs": [ + { + "data": { + "image/png": "iVBORw0KGgoAAAANSUhEUgAABRAAAAH5CAYAAAD5mBLdAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjcuMSwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy/bCgiHAAAACXBIWXMAAA9hAAAPYQGoP6dpAACJbklEQVR4nOzdd7yO9ePH8dd9jnWMc+wVoSIkEQ3toUgp0hJFg0qUEtHQEqXIqjRklJKS0lKqLy1ktIkGUjIqnOxx7t8fn19HCqFzXGe8no/H9TjXPc593tbtnPf1GbF4PB5HkiRJkiRJknYgIeoAkiRJkiRJkrIuC0RJkiRJkiRJO2WBKEmSJEmSJGmnLBAlSZIkSZIk7ZQFoiRJkiRJkqSdskCUJEmSJEmStFMWiJIkSZIkSZJ2Kk/UAfZGWloaS5YsoUiRIsRisajjSJIkSZIkSdlKPB7njz/+oHz58iQk7HqMYbYsEJcsWULFihWjjiFJkiRJkiRla4sXL6ZChQq7fE62LBCLFCkChF9gcnJyxGkkSZIkSZKk7CU1NZWKFSum92y7ki0LxD+nLScnJ1sgSpIkSZIkSXtpd5YHdBMVSZIkSZIkSTtlgShJkiRJkiRppywQJUmSJEmSJO2UBaIkSZIkSZKknbJAlCRJkiRJkrRTFoiSJEmSJEmSdsoCUZIkSZIkSdJOWSBKkiRJkiRJ2ikLREmSJEmSJEk7ZYEoSZIkSZIkaacsECVJkiRJkiTtlAWiJEmSJEmSpJ2yQJQkSZIkSZK0UxaIkiRJkiRJknZqjwvE999/n6ZNm1K+fHlisRgvv/zydo/H43F69uxJuXLlSEpKomHDhnz77bfbPef333+nVatWJCcnU7RoUa644grWrFnzn34hkiRJkiRJkjLeHheIa9eu5bDDDuPhhx/e4eN9+/Zl0KBBDB06lOnTp1OoUCEaNWrEhg0b0p/TqlUrvv76ayZNmsRrr73G+++/T/v27ff+VyFJkiRJkiQpU8Ti8Xh8rz85FmP8+PE0a9YMCKMPy5cvT5cuXbjpppsAWL16NWXKlGHEiBFcdNFFzJ07l5o1azJjxgzq168PwMSJE2nSpAk//fQT5cuX/9evm5qaSkpKCqtXryY5OXlv42dt69dDUlLUKSRJkiRJknKnHN7N7Em/lqFrIC5YsIClS5fSsGHD9PtSUlI46qijmDp1KgBTp06laNGi6eUhQMOGDUlISGD69Ok7fN2NGzeSmpq63ZGjjRsHVarAjBlRJ5EkSZIkScp9li+HatWgb19IS4s6TeQytEBcunQpAGXKlNnu/jJlyqQ/tnTpUkqXLr3d43ny5KF48eLpz/m7Pn36kJKSkn5UrFgxI2NnPWPHwrJl0KoVuDakJEmSJEnSvhOPw+WXw08/wTPPwKZNUSeKXLbYhblHjx6sXr06/Vi8eHHUkTLXo4/CfvvBt9/CjTdGnUaSJEmSJCn3GDoUXn8d8ueH0aOhQIGoE0UuQwvEsmXLArBs2bLt7l+2bFn6Y2XLlmX58uXbPb5lyxZ+//339Of8Xf78+UlOTt7uyNGKF4dRoyAWgyeegL/tdC1JkiRJkqRM8M030KVLOL/vPjj00GjzZBEZWiBWqVKFsmXL8u6776bfl5qayvTp02nQoAEADRo0YNWqVcyaNSv9Oe+99x5paWkcddRRGRknezvllG1/Ya+8En75Jdo8kiRJkiRJOdmmTWE5ufXr4bTT4Lrrok6UZexxgbhmzRo+++wzPvvsMyBsnPLZZ5/x448/EovF6Ny5M7169WLChAl8+eWXXHrppZQvXz59p+YaNWrQuHFj2rVrxyeffMJHH31Ex44dueiii3ZrB+ZcpVcvqFMHfvstzL3f+w2zJUmSJEmStCt33AGzZ0OJEjBiBCRki5X/9olYPL5nrdTkyZM5+eST/3F/mzZtGDFiBPF4nDvuuIPHH3+cVatWcdxxx/HII49QrVq19Of+/vvvdOzYkVdffZWEhARatGjBoEGDKFy48G5l2JNtprO9OXOgXj3YsAEGDYJOnaJOJEmSJEmSlLNMmQInnxwGb40bB+eeG3WiTLcn/doeF4hZQa4qEAEGDw7DZvPnh1mz4JBDok4kSZIkSZKUM6xaBbVrw+LFYQbosGFRJ9on9qRfcyxmdtCxIzRuDBs3wsUXh4+SJEmSJEn67zp0COXhgQfCwIFRp8mSLBCzg1gMhg+HkiXhiy/gttuiTiRJkiRJkpT9PfssPPccJCbC6NGwm8vr5TYWiNlF2bLbhtD26wfvvRdtHkmSJEmSpOxs0SK45ppw3rMnHHVUtHmyMAvE7OTss6F9+7Cg56WXwu+/R51IkiRJkiQp+9m6FS65BFJToUEDuOWWqBNlaRaI2U3//lC1Kvz8M1x9dSgTJUmSJEmStPv69oUPPghTlp95BvLkiTpRlmaBmN0UKhTm5OfJAy+8AKNGRZ1IkiRJkiQp+5g5M0xZBhg8GA44INo82YAFYnZ0xBFw553hvGNH+OGHSONIkiRJkiRlC2vXQqtWsGULnHcetGkTdaJswQIxu+reHY47DtasCXP2t2yJOpEkSZIkSVLWdtNNMH8+7LcfPPYYxGJRJ8oWLBCzq8REePppSE6Gjz+GPn2iTiRJkiRJkpR1vfoqDB0azkeOhOLFo82TjVggZmeVK8PDD4fzu+6C6dMjjSNJkiRJkpQlLVsGV1wRzm+8EU49Ndo82YwFYnbXqhVceGHYfrx16zClWZIkSZIkSUE8DpdfDitWQO3a0Lt31ImyHQvE7C4Wg0cfhYoV4bvvoHPnqBNJkiRJkiRlHY88Am+8Afnzw7PPho/aIxaIOUGxYjBqVCgThw2D8eOjTiRJkiRJkhS9uXPDxikAffvCIYdEmyebskDMKU46Cbp2Deft2sGSJZHGkSRJkiRJitSmTWHptw0boFEj6NQp6kTZlgViTnLPPVC3Lvz2G1x2GaSlRZ1IkiRJkiQpGrffDp9+CiVKwPDhYeam9ooFYk6SLx+MHg0FCsDbb8PgwVEnkiRJkiRJ2vcmT4YHHgjnTz4J5cpFGie7s0DMaWrUgAcfDOc33wxffhltHkmSJEmSpH1p5Uq45JKw+/KVV0KzZlEnyvYsEHOiDh2gSRPYuHHbXH9JkiRJkqScLh6Ha66Bn36Cgw6Chx6KOlGOYIGYE8Vi8NRTUKpUGIF4661RJ5IkSZIkScp8o0fD889DYmI4L1w46kQ5ggViTlWmTCgRAfr3h3feiTaPJEmSJElSZlq4EK69NpzfeScceWSUaXIUC8Sc7Kyz4Oqrw3mbNmF3ZkmSJEmSpJxm69aw7mFqKhxzDHTvHnWiHMUCMad78EGoVg2WLIGrrgprAUiSJEmSJOUk990HH34IRYrAM89AnjxRJ8pRLBBzukKF4Nlnwz+cceNg5MioE0mSJEmSJGWcGTPClGWAIUOgSpVI4+REFoi5Qb16cPfd4bxTJ/j++2jzSJIkSZIkZYS1a6F1a9iyBS64IExjVoazQMwtunWDE06ANWvCP6YtW6JOJEmSJEmS9N/ceCPMnw8VKsDQoRCLRZ0oR7JAzC0SE2HUKEhJgalT4d57o04kSZIkSZK09155BR5/PJSGI0dCsWJRJ8qxLBBzk0qV4JFHwvk998C0adHmkSRJkiRJ2htLl8KVV4bzLl3glFOizZPDWSDmNhdfDC1bhu3NW7WCP/6IOpEkSZIkSdLui8fhssvg11+hTh3o1SvqRDmeBWJu9MgjsP/+8MMP0Llz1GkkSZIkSZJ238MPw8SJUKAAjB4N+fNHnSjHs0DMjYoWDeshxmLw1FPw0ktRJ5IkSZIkSfp3c+ZA167h/IEHoGbNaPPkEhaIudWJJ8LNN4fzdu3g55+jzSNJkiRJkrQrGzeGpdk2bIDGjeHaa6NOlGtYIOZmd90Fhx8Ov/8ObdtCWlrUiSRJkiRJknbsttvg88+hZEkYPjzMrNQ+YYGYm+XLF9YKSEqCd96BgQOjTiRJkiRJkvRP770H/fqF82HDoGzZaPPkMhaIuV316tv+AXbvDl9+GW0eSZIkSZKkv1q5Ei69NOy+3L49nH121IlyHQtEwdVXw1lnwaZN29YSkCRJkiRJilo8HnqLn3+GqlWhf/+oE+VKFogKawYMGwalS8NXX0GPHlEnkiRJkiRJgqefhrFjIU+esAxboUJRJ8qVLBAVlC4dFiAFGDAA3n470jiSJEmSJCmXW7AAOnYM53feCUccEWmc3MwCUds0aQIdOoTztm3h118jjSNJkiRJknKpLVugdWv44w847riwb4MiY4Go7T3wQNhY5Zdf4KqrwloDkiRJkiRJ+9J998HHH0NycpjGnJgYdaJczQJR2ytYMKwpkDcvvPTStmnNkiRJkiRJ+8Inn4QpywAPPwyVK0eZRlggakcOPxzuuSecX3cdfPddtHkkSZIkSVLusGYNtGoFW7fChReGc0XOAlE7dtNNcOKJsHZtWHNg8+aoE0mSJEmSpJzuhhvCQKaKFeHRRyEWizqRsEDUziQmwqhRkJIC06dDr15RJ5IkSZIkSTnZ+PHw5JOhNBw1CooVizqR/p8FonZu//1D2w+hQPz442jzSJIkSZKknGnJEmjXLpx37QonnRRpHG3PAlG71rJlWG8gLW3b9umSJEmSJEkZJS0NLrsMfvsN6tbdti+DsgwLRP27hx+GSpVgwYKwqYokSZIkSVJGGTIE3n4bChSA0aMhX76oE+lvLBD171JS4OmnISEBRoyAF1+MOpEkSZIkScoJvvoKunUL5w8+CDVqRJtHO2SBqN1z/PHQvXs4b98efvop2jySJEmSJCl727gxLJu2cSM0aQIdOkSdSDthgajdd+edUL8+rFwJbduGNQokSZIkSZL2xi23wBdfQKlS8NRTYfdlZUkWiNp9efPCM89AwYLw7rswYEDUiSRJkiRJUnb07rvQv384f+opKFMm2jzaJQtE7ZmDD972D7xHD/j882jzSJIkSZKk7OX336FNm3B+9dVw1lnR5tG/skDUnmvfHs4+GzZtCmsVrF8fdSJJkiRJkpQdxONw1VXw889QrVrYOEVZngWi9lwsBk8+GYYXf/31ts1VJEmSJEmSdmXkSHjxRciTB559FgoVijqRdoMFovZOqVIwfHg4HzQI3nor2jySJEmSJClr+/576NQpnN99N9SrF20e7TYLRO29M86Ajh3Dedu28OuvkcaRJEmSJElZ1JYtcMklsGYNnHACdOsWdSLtAQtE/Td9+0KNGrB0KbRrF9YykCRJkiRJ+qvevWHqVEhOhlGjIDEx6kTaAxaI+m+SksKaBXnzwssvw7BhUSeSJEmSJElZybRpYcoywCOPQKVK0ebRHrNA1H9Xpw7ce284v/56+PbbSONIkiRJkqQs4o8/oHVr2LoVWraEVq2iTqS9YIGojNGlC5x8MqxbF94MNm+OOpEkSZIkSYpa585h85T99w+jD5UtWSAqYyQkhK3YixaFGTO2DU2WJEmSJEm500svwVNPQSwW1j0sWjTqRNpLFojKOBUrwtCh4bx3b/joo2jzSJIkSZKkaCxZEjZbBbj5ZjjxxGjz6D+xQFTGuvDCsC17WlpY4yA1NepEkiRJkiRpX0pLg7Zt4fff4fDD4a67ok6k/8gCURlvyBCoXBkWLoROnaJOI0mSJEmS9qVBg2DSJEhKgtGjIV++qBPpP7JAVMZLToZnngnrIo4aBWPHRp1IkiRJkiTtC19+Cd27h/N+/aB69WjzKENYICpzHHss3HJLOL/qKli8ONo8kiRJkiQpc23YABdfDBs3wllnwdVXR51IGcQCUZmnZ0844ghYtQratAlrIEiSJEmSpJzpllvgq6+gdGkYNizsvqwcwQJRmSdv3jCVuWBB+N//oH//qBNJkiRJkqTMMGkSPPRQOB82LJSIyjEsEJW5qlWDAQPC+S23wGefRZlGkiRJkiRltN9+C7suA1xzTZi+rBzFAlGZ78or4ZxzYPPmsBbC+vVRJ5IkSZIkSRkhHof27WHJkrBhyoMPRp1ImcACUZkvFoMnn4SyZWHuXOjWLepEkiRJkiQpIwwfDi+9FJYxGz06LGOmHMcCUftGyZIwYkQ4HzIE3nwz0jiSJEmSJOk/+v57uO66cH7PPXD44dHmUaaxQNS+06gRdOoUzi+7DFasiDaPJEmSJEnaO1u2QOvWsHYtnHgi3HRT1ImUiSwQtW/dfz8ccggsWxbWRozHo04kSZIkSZL2VK9eMG0apKTAqFGQmBh1ImUiC0TtW0lJYU2EfPlgwgR44omoE0mSJEmSpD0xdWqYsgzw6KOw//7R5lGmy/ACcevWrdx+++1UqVKFpKQkDjzwQO655x7ifxlpFo/H6dmzJ+XKlSMpKYmGDRvy7bffZnQUZVWHHQa9e4fzG26A+fOjzSNJkiRJknbPH3+EqctpadCqFbRsGXUi7QMZXiDef//9PProowwZMoS5c+dy//3307dvXwYPHpz+nL59+zJo0CCGDh3K9OnTKVSoEI0aNWLDhg0ZHUdZ1Q03wKmnwrp14Q1n8+aoE0mSJEmSpH9z3XXwww9QqRI8/HDUabSPxOLxjF2E7qyzzqJMmTIMGzYs/b4WLVqQlJTEM888Qzwep3z58nTp0oWb/n+BzdWrV1OmTBlGjBjBRRdd9K9fIzU1lZSUFFavXk1ycnJGxte+9NNPULs2rFwJPXpsG5UoSZIkSZKynhdegAsugFgMpkyB44+POpH+gz3p1zJ8BOIxxxzDu+++y/z/n5b6+eef8+GHH3LGGWcAsGDBApYuXUrDhg3TPyclJYWjjjqKqVOn7vA1N27cSGpq6naHcoAKFeCxx8J5nz5hTURJkiRJkpT1zJ0Ll18ezrt3tzzMZTK8QOzevTsXXXQR1atXJ2/evNStW5fOnTvTqlUrAJYuXQpAmTJltvu8MmXKpD/2d3369CElJSX9qFixYkbHVlTOPx86dQrnrVvDvHnR5pEkSZIkSdtbvRqaNYM1a+Ckk+Cuu6JOpH0swwvEsWPHMnr0aJ599llmz57NyJEjefDBBxk5cuRev2aPHj1YvXp1+rF48eIMTKzI9esXrlz88Qc0bx4+SpIkSZKk6KWlwaWXhg1QK1SA55+HvHmjTqV9LE9Gv2DXrl3TRyECHHrooSxatIg+ffrQpk0bypYtC8CyZcsoV65c+uctW7aMOnXq7PA18+fPT/78+TM6qrKKvHnDOgr16oUh0W3awIsvQkKG99uSJEmSJGlP3HtvWHIsf3546SUoXTrqRIpAhjc069atI+FvxU9iYiJpaWkAVKlShbJly/Luu++mP56amsr06dNp0KBBRsdRdlGmDIwbB/nywfjxcN99USeSJEmSJCl3e/11uOOOcP7oo3DEEdHmUWQyvEBs2rQp9957L6+//joLFy5k/Pjx9O/fn+bNmwMQi8Xo3LkzvXr1YsKECXz55ZdceumllC9fnmbNmmV0HGUnRx0FQ4aE89tug4kTo80jSZIkSVJu9e230KoVxONwzTVw2WVRJ1KEYvF4PJ6RL/jHH39w++23M378eJYvX0758uVp2bIlPXv2JF++fADE43HuuOMOHn/8cVatWsVxxx3HI488QrVq1Xbra+zJNtPKhq66Ch5/HIoWhZkz4cADo04kSZIkSVLusWZNGOQzZw4ccwz8739hxqBylD3p1zK8QNwXLBBzuI0bw65O06bBoYfC1KlQqFDUqSRJkiRJyvnicbjggrA3QblyMGtW+KgcZ0/6NXepUNaTP394oypTBr78Eq64IryBSZIkSZKkzNW3b/iZPG/ebSWicj0LRGVN++0X3qjy5AlbxPfvH3UiSZIkSZJytkmT4JZbwvmgQWH6soQForKy446DAQPCebdu8N57kcaRJEmSJCnHWrAALroI0tLCTMCrroo6kbIQC0RlbR06QJs24Q3sggtg0aKoE0mSJEmSlLOsWwfNm8Pvv8MRR8CQIRCLRZ1KWYgForK2WAwefRQOPxx++w3OPRfWr486lSRJkiRJOUM8Du3bw+efQ6lSMG4cFCgQdSplMRaIyvqSkuCll6BkSZg9G66+2k1VJEmSJEnKCAMHwujRkJgIL7wAFStGnUhZkAWisodKlcJmKgkJMGoUPPxw1IkkSZIkScreJk+Gm24K5/36wYknRhpHWZcForKPU06BBx4I5zfcAB98EG0eSZIkSZKyq8WLw14DW7dC69Zw3XVRJ1IWZoGo7OWGG8KuUFu2wHnnwc8/R51IkiRJkqTsZcOGsMfAihVQpw489pibpmiXLBCVvcRi8OSTULs2LF8OLVrAxo1Rp5IkSZIkKXuIx6FDB5g5E4oXh/HjoWDBqFMpi7NAVPZTqFDYVKVYMZg+HTp1ijqRJEmSJEnZw9ChMHx42GNgzBioXDnqRMoGLBCVPR14IDz7bBiR+MQT4ZAkSZIkSTv30Udw/fXhvE8fOO20aPMo27BAVPbVuDHce28479gRpk2LNo8kSZIkSVnVkiVhL4HNm+H886Fr16gTKRuxQFT21r17WPh106awHuLSpVEnkiRJkiQpa9m0KZSHS5dCrVrw1FNumqI9YoGo7C0WgxEjoEaNcDXl/PPDG6MkSZIkSQquvx6mToWiRcOmKYULR51I2YwForK/IkXg5ZchORk+/BC6dIk6kSRJkiRJWcNTT4WNU2IxGD0aDjoo6kTKhiwQlTNUqwZPPx3OhwyBkSOjzSNJkiRJUtQ++QSuuSac33UXNGkSbR5lWxaIyjnOPhvuuCOcX3UVzJoVbR5JkiRJkqKyfHnYK2DTJjjnHLj11qgTKRuzQFTO0rMnnHUWbNwYNldZsSLqRJIkSZIk7VubN8MFF8BPP8HBB8OoUZBgBaS9598e5SwJCWEqc9Wq8OOPcNFFsGVL1KkkSZIkSdp3unaFKVO23zNA+g8sEJXz/LmrVKFC8N570L171IkkSZIkSdo3nnkGBg4M56NGQfXq0eZRjmCBqJzpkENgxIhw3q8fjBkTaRxJkiRJkjLdp59Cu3bh/NZboVmzSOMo57BAVM513nnbRh9efjl88UW0eSRJkiRJyiy//Rb2AtiwAc44I+y6LGUQC0TlbL16wemnw/r10Lw5/P571IkkSZIkScpYW7aEPQAWLoQDD4TRoyExMepUykEsEJWzJSbCc89BlSrwww/QqhVs3Rp1KkmSJEmSMs6tt8I770DBgmFPgGLFok6kHMYCUTlf8eLhDTQpCSZOhJ49o04kSZIkSVLGGDsW+vYN58OHw6GHRptHOZIFonKHww6DJ58M5717w0svRZtHkiRJkqT/6quvwpr/AF27wgUXRJtHOZYFonKPiy+GG24I523awJw50eaRJEmSJGlvrVwZdlleuxZOPTUMlpEyiQWicpe+feGkk2DNmrCpyurVUSeSJEmSJGnPpKVB69bw/fdQqRKMGQN58kSdSjmYBaJylzx54PnnoWJFmD8fLr00vPFKkiRJkpRd3HknvPEGFCgQlugqWTLqRMrhLBCV+5QuHd5g8+eHCROgV6+oE0mSJEmStHteeQXuuSecP/44HH54tHmUK1ggKneqXx+GDg3nd94Jr70WaRxJkiRJkv7VN9/AJZeE8+uu23YuZTILROVebdtChw4Qj4e1I779NupEkiRJkiTtWGpqWMv/jz/ghBPgwQejTqRcxAJRudtDD8Gxx4bNVJo1C2/EkiRJkiRlJWlp0KZNGIG4334wdizkzRt1KuUiFojK3fLlgxdegHLlYM4cuPzyMCJRkiRJkqSsok8fePnl8DPsuHFQpkzUiZTLWCBK5cqFN+C8eeHFF6Fv36gTSZIkSZIUvPkm3H57OH/4YTjqqGjzKFeyQJQAGjSAwYPD+S23wNtvR5tHkiRJkqTvvoOLLw4z5a66Cq68MupEyqUsEKU/tW8PV1wR1pa46CJYsCDqRJIkSZKk3GrNmrBpyqpVcPTRMHBg1ImUi1kgSn+KxWDIEDjySFi5MrxRr1sXdSpJkiRJUm4Tj4cBLl99BWXLhmW38uePOpVyMQtE6a8KFAhvzKVLw+efQ7t2bqoiSZIkSdq3+vULOy3nyRM2/ixfPupEyuUsEKW/q1AhvFEnJsKzzzpMXJIkSZK077zzDtx8czgfMACOOy7SOBJYIEo7duKJ0L9/OL/pJpg8OdI4kiRJkqRcYOHCsCZ/Whq0bQsdOkSdSAIsEKWd69QJWreGrVvhggtg8eKoE0mSJEmScqr16+Hcc+G336BePXj00bBWv5QFWCBKOxOLwWOPQd26sGJFeCPfsCHqVJIkSZKknCYeh6uugk8/hZIl4aWXwhr9UhZhgSjtSsGC4Y27RAmYOTMMH3dTFUmSJElSRhoyBJ5+OqzFP3Ys7L9/1Imk7VggSv+mcmUYMwYSEmD4cBg6NOpEkiRJkqSc4v334YYbwnnfvnDyydHmkXbAAlHaHQ0bwn33hfPrr4ePPoo2jyRJkiQp+/vpJzj//LD2fsuW24pEKYuxQJR21003hc1UNm+G886DJUuiTiRJkiRJyq42boQWLWD5cqhdG5580k1TlGVZIEq7KxaDYcOgVi1YujSUiJs2RZ1KkiRJkpQddewIn3wCxYrB+PFhDX4pi7JAlPZE4cLhjb1oUZg6NUxnliRJkiRpTzz++LYRh889BwccEHUiaZcsEKU9ddBBMHp0eKMfOjSMSpQkSZIkaXdMnRpGHwL07g2NGkWbR9oNFojS3mjSBO6+O5x36BCGnUuSJEmStCu//BLWPdy8OXy8+eaoE0m7xQJR2lu33ALnnBPWQfxz4VtJkiRJknZk06aw4/Ivv0DNmjB8uJumKNuwQJT2VkICjBoFBx8MP/20bYdmSZIkSZL+7sYb4aOPIDk5rK1fpEjUiaTdZoEo/RfJyfDyy+GNf8oU6No16kSSJEmSpKxmxAh4+OFwPno0VKsWaRxpT1kgSv9V9ephJCLAwIHwzDPR5pEkSZIkZR0zZ8LVV4fzO++Es86KNI60NywQpYzQrBncdls4b9cOPv000jiSJEmSpCxgxQo491zYuBGaNoXbb486kbRXLBCljHLnnXDGGbBhQ/gP4rffok4kSZIkSYrKli1hrfzFi6FqVXj66bCWvpQN+TdXyiiJiWEtiwMPhIUL4aKLwn8YkiRJkqTc5+abYfJkKFw4rJ2fkhJ1ImmvWSBKGalYsfAfQ8GC8M47cOutUSeSJEmSJO1rzz4L/fuH8xEjoGbNSONI/5UFopTRatWC4cPDed++MHZstHkkSZIkSfvO55/DlVeG8x49oEWLaPNIGcACUcoMF1wAXbuG88svh6++ijaPJEmSJCnz/f47NG8O69dDo0Zwzz1RJ5IyhAWilFl694ZTT4W1a8N/IKtWRZ1IkiRJkpRZtm6Fli1hwQKoUiVMY05MjDqVlCEsEKXMkicPjBkDlSrBd99Bq1aQlhZ1KkmSJElSZrj9dnj7bUhKgvHjoXjxqBNJGcYCUcpMJUuG/zgKFIA33oA774w6kSRJkiQpo40bB336hPNhw+Cww6LNI2UwC0Qps9WtC48/Hs7vuQdeeSXaPJIkSZKkjPP119CmTTi/8cYwjVnKYSwQpX3hkkvguuu2nX/+ebR5JEmSJEn/3fLl0KxZWPv+5JPh/vujTiRlCgtEaV958EE46ST44w9o3Bh++CHqRJIkSZKkvfXHH9CkSVjzvlIleP75sBa+lANZIEr7St68YT3E2rVh6VJo1ChcrZIkSZIkZS+bNsG558KsWWHt+7ffhlKlok4lZRoLRGlfKloUJk6EypXDVaomTcJVK0mSJElS9pCWFtY8fOcdKFQobJhZrVrUqaRMZYEo7Wvlym27OjVrFjRvDhs3Rp1KkiRJkvRv4nHo3BnGjAnTlV96CY44IupUUqazQJSiULVquEpVuDC8+264epWWFnUqSZIkSdKu9OkDgweH85Ej4fTTo80j7SMWiFJU6tcPV6vy5g2L7V5/fbiaJUmSJEnKep58Em69NZwPGAAXXxxpHGlfypQC8eeff6Z169aUKFGCpKQkDj30UGbOnJn+eDwep2fPnpQrV46kpCQaNmzIt99+mxlRpKzttNNg1KhwPmQI9O4dbR5JkiRJ0j+98gpcdVU47949DACRcpEMLxBXrlzJscceS968eXnzzTeZM2cO/fr1o1ixYunP6du3L4MGDWLo0KFMnz6dQoUK0ahRIzZs2JDRcaSs76KLYODAcH7bbeGqliRJkiQpa/jgg/BzW1oaXHaZAz+UK8Xi8YydM9m9e3c++ugjPvjggx0+Ho/HKV++PF26dOGmm24CYPXq1ZQpU4YRI0Zw0UUX/evXSE1NJSUlhdWrV5OcnJyR8aXo3Hpr+I8oIQHGjYNmzaJOJEmSJEm525dfwvHHw+rVcNZZMH582DxFygH2pF/L8BGIEyZMoH79+px//vmULl2aunXr8sQTT6Q/vmDBApYuXUrDhg3T70tJSeGoo45i6tSpO3zNjRs3kpqaut0h5Ti9esEVV4SrWhddBO+/H3UiSZIkScq9Fi6ERo1CeXjssWHtestD5VIZXiD+8MMPPProo1StWpW33nqLa665huuuu46RI0cCsHTpUgDKlCmz3eeVKVMm/bG/69OnDykpKelHxYoVMzq2FL1YDIYOhbPPho0bw8cvvog6lSRJkiTlPr/+GsrDX36BQw6BCROgYMGoU0mRyfACMS0tjcMPP5zevXtTt25d2rdvT7t27Rg6dOhev2aPHj1YvXp1+rF48eIMTCxlIXnywJgxcNxx4SpX48bhqpckSZIkad9YswaaNIH586FiRZg4EYoXjzqVFKkMLxDLlStHzZo1t7uvRo0a/PjjjwCULVsWgGXLlm33nGXLlqU/9nf58+cnOTl5u0PKsZKSwtWtWrXC1a5GjWDFiqhTSZIkSVLOt2kTtGgBM2aE0vDtt6FChahTSZHL8ALx2GOPZd68edvdN3/+fCpVqgRAlSpVKFu2LO+++27646mpqUyfPp0GDRpkdBwpeypWLFzlqlQpXPVq0iRcBZMkSZIkZY4/d1l+++0wXfmNN6B69ahTSVlChheIN9xwA9OmTaN379589913PPvsszz++ONce+21AMRiMTp37kyvXr2YMGECX375JZdeeinly5enmbvOStvstx+89RaUKAEzZ8K554arYZIkSZKkjBWPQ5cu8OyzYWmpcePgqKOiTiVlGRleIB5xxBGMHz+e5557jlq1anHPPfcwYMAAWrVqlf6cbt260alTJ9q3b88RRxzBmjVrmDhxIgUKFMjoOFL2dvDB4apXoUIwaRK0bRuuikmSJEmSMk7fvjBgQDgfPjysRy8pXSwej8ejDrGnUlNTSUlJYfXq1a6HqNzhrbfgrLNgyxa4/np46KGwa7MkSZIk6b8ZPhwuvzyc9+sHN94YbR5pH9mTfi3DRyBKygSNGsGIEeF84EC4//5I40iSJElSjvDqq9CuXTjv2tXyUNoJC0Qpu2jVKow8BOjRA556Kto8kiRJkpSdffwxXHABbN0Kbdo4UEPaBQtEKTvp3Bluvjmct2sHEyZEGkeSJEmSsqWvvw7LRG3YAGeeCU884TJR0i5YIErZTZ8+cNllYTOVCy+EDz+MOpEkSZIkZR8//hiWiVq5Eo4+GsaOhbx5o04lZWkWiFJ2E4vB449vu1rWtCl89VXUqSRJkiQp6/v111Ae/vwz1KgBr70GBQtGnUrK8iwQpewoTx54/nk45hhYtSr8B7hoUdSpJEmSJCnrWrs2DMT45huoUAHeegtKlIg6lZQtWCBK2VXBgmHHsEMOgSVLQon4669Rp5IkSZKkrGfzZjj/fJg+HYoXD+VhxYpRp5KyDQtEKTsrXhwmTgz/8c2bFxb/Xbs26lSSJEmSlHWkpcHll8Obb0JSUpi2XLNm1KmkbMUCUcru/hx6X7w4fPIJnHdeuLomSZIkSYJu3eCZZyAxEV54ARo0iDqRlO1YIEo5QY0a8MYbYVrzxInh6lpaWtSpJEmSJClaDz4I/fqF86eeCrO2JO0xC0QppzjqKHjxxbDByjPPQNeuEI9HnUqSJEmSojFqVPi5CKBvX7j00mjzSNmYBaKUk5xxRriqBtC/f7jaJkmSJEm5zRtvhJlZAF26bCsSJe0VC0Qpp7nkkm3FYbduMHJktHkkSZIkaV+aNi2sDb91K7RuHUYfSvpPLBClnKhLF7jppnB+xRXw+uvR5pEkSZKkfWHu3LDO4fr10LhxmKGVYPUh/Vf+K5JyqvvvD2t8bN0K558PH38cdSJJkiRJyjyLF8Ppp8Pvv8ORR4Y14vPmjTqVlCNYIEo5VUICPPkkNGkSrr6ddRbMmRN1KkmSJEnKeL//HkYc/vQTHHxwmIVVqFDUqaQcwwJRysny5oWxY+Hoo2HlSmjUKFyVkyRJkqScYt26bQMm9tsP3n4bSpaMOpWUo1ggSjldoULw2mtQo0a4GteoEfz2W9SpJEmSJOm/27wZLrgApk6FokVh4kTYf/+oU0k5jgWilBuUKAFvvQUVKoRFhc86C9aujTqVJEmSJO29eBzatQvTlQsUCAMnatWKOpWUI1kgSrlFxYqhRCxWDKZNC1fpNm+OOpUkSZIk7Z3u3WHkSEhMDEs3HXts1ImkHMsCUcpNatYMV+eSkuCNN+DKKyEtLepUkiRJkrRn+veHvn3D+RNPQNOm0eaRcjgLRCm3adAAXnghXKUbNSpctZMkSZKk7OKZZ6BLl3Depw9cdlm0eaRcwAJRyo3OPBOGDQvnDzwA/fpFm0eSJEmSdsfEidsKw86d4eabI40j5RYWiFJu1aYN3H9/OL/pJnj66WjzSJIkSdKuTJ8OLVrAli1w8cVhIEQsFnUqKVewQJRys65d4cYbw/nll8Obb0abR5IkSZJ25Jtvwkyqdevg9NNh+HBIsNKQ9hX/tUm5WSwWpjC3bh2u4p13XtihWZIkSZKyip9+gkaN4Lff4IgjYNw4yJcv6lRSrmKBKOV2CQnw1FPQuHG4mnfmmTB3btSpJEmSJAlWrgw/q/z4I1SrBq+/DoULR51KynUsECVB3rxhZ+Yjj4Tffw9X9376KepUkiRJknKz9euhaVP4+msoXx7eegtKlYo6lZQrWSBKCgoXDlfzDj4YFi8OJeLvv0edSpIkSVJutGULXHghfPQRpKSE3ZcrV446lZRrWSBK2qZkyXBVb7/9YM6ccLVv3bqoU0mSJEnKTeJxuOoqePVVKFAgfDz00KhTSbmaBaKk7VWqFK7uFS0KH38crvpt3hx1KkmSJEm5xa23hnXaExJgzBg4/vioE0m5ngWipH+qVWvb1b7XXoP27cNVQEmSJEnKTAMHQp8+4fyxx+Ccc6LNIwmwQJS0M8cdB2PHQmIijBgBPXpEnUiSJElSTvbcc9C5czi/91648spI40jaxgJR0s41bQqPPx7O778fHnoo2jySJEmScqa334Y2bcJ5p04OYJCyGAtESbt2+eXbphDceCOMHh1tHkmSJEk5y4wZcO65Ye31Cy+EAQMgFos6laS/sECU9O9uvhmuvz6ct20bdmqWJEmSpP9q/nxo0gTWroWGDWHkyLB5iqQsxX+Vkv5dLAb9+0PLlrBlC7RoAZ98EnUqSZIkSdnZkiVw+unw669Qrx689BLkzx91Kkk7YIEoafckJITNVE47LVwdbNIE5s2LOpUkSZKk7GjVKmjcGBYtgoMOgjfegCJFok4laScsECXtvnz5YNw4qF8ffvstXC38+eeoU0mSJEnKTtavh7PPhi+/hLJlwwYqpUtHnUrSLlggStozRYqEq4NVq8KPP4arhitXRp1KkiRJUnawZQtcfDF88AEkJ8PEiVClStSpJP0LC0RJe65UqXCVsFw5+OqrcPVw/fqoU0mSJEnKyuJxuOYaePnlsNbhhAlw2GFRp5K0GywQJe2dypXD1cKUFPjwQ7joonA1UZIkSZJ2pGdPePLJsL76s8/CiSdGnUjSbrJAlLT3atcOVw3/vHp49dXhqqIkSZIk/dWQIdCrVzh/9FE499xo80jaIxaIkv6bE06AMWPCVcRhw+C226JOJEmSJCkrGTsWrrsunN99N7RvH20eSXvMAlHSf9esGTz2WDjv3RsGDYo0jiRJkqQs4p13oHXrMFPp2msdcCBlUxaIkjLGlVdum5LQuXMYlShJkiQp95o1C5o3h82b4fzzYeBAiMWiTiVpL1ggSso4t9wCHTuGq4uXXgqTJkWdSJIkSVIUvv0WzjgD1qyBU06Bp5+GxMSoU0naSxaIkjJOLBauKl5wQbjK2Lw5TJsWdSpJkiRJ+9JPP0GjRrBiBdStC+PHh40XJWVbFoiSMlZCAowaBaeeCmvXQsOG8L//RZ1KkiRJ0r7w3Xdw3HGwYAEceCC8+SYkJ0edStJ/ZIEoKePlzw+vvBLKw7Vrw9SFV1+NOpUkSZKkzPTVV3D88bBoEVStCu+9B2XKRJ1KUgawQJSUOQoVCqXhOefAxo1w7rlurCJJkiTlVDNmwIknwtKlULs2fPAB7L9/1KkkZRALREmZp0ABeOEFaNUKtmyBiy+GJ56IOpUkSZKkjDRlStgo5fff4aijYPJkRx5KOYwFoqTMlTdvWBPx6qvD7szt20P//lGnkiRJkpQR3ngDGjcOuy2ffDJMmgTFikWdSlIGs0CUlPkSEuCRR6Bbt3C7Sxe4445QKEqSJEnKnsaODUsWbdgATZuGMrFIkahTScoEFoiS9o1YDO6/H3r3DrfvvhtuvNESUZIkScqOnnoKWrYMSxW1bAnjxoUljCTlSBaIkvatHj1g8OBwPmAAtGsHW7dGGkmSJEnSHhgwAK64AtLSwvfzTz8dli6SlGNZIEra9zp2hBEjwtTmYcPC5iqbNkWdSpIkSdKuxONwzz1www3hdpcu8NhjkJgYbS5Jmc4CUVI02rQJa6bkzRs+Nm8O69dHnUqSJEnSjsTj0LUr9OwZbt99NzzwQFiqSFKOZ4EoKTotWsCECZCUFBZcPuMMSE2NOpUkSZKkv9q6Fa66Cvr1C7cHDIDbb7c8lHIRC0RJ0WrcGN56C5KTYcoUaNgQfvst6lSSJEmSADZvhtat4Yknti1BdP31UaeStI9ZIEqK3vHHw3vvQYkSMGMGnHQS/PJL1KkkSZKk3G3DhjBraMwYyJMHnnsOLr886lSSImCBKClrqFcP3n8fypWDr76CE06ARYuiTiVJkiTlTn/8AU2awKuvQoEC8MorcMEFUaeSFBELRElZR82a8OGHUKUKfPcdHHcczJsXdSpJkiQpd/n9dzjtNPjf/6BwYZg4MZSJknItC0RJWcsBB8AHH0CNGvDTT2F682efRZ1KkiRJyh2WLYOTT4bp06F48bDU0IknRp1KUsQsECVlPfvtFzZUqVsXVqwIayJOnRp1KkmSJCln+/HHcAH/iy+gbNnwPfkRR0SdSlIWYIEoKWsqVSpMmTj2WFi9OkyhePfdqFNJkiRJOdP8+WEJoW+/hUqVwqygWrWiTiUpi7BAlJR1paTAW2/B6afD2rVh3ZUJE6JOJUmSJOUsX3wRRh4uXgzVqoXy8KCDok4lKQuxQJSUtRUqFErD5s1h0yY491x49tmoU0mSJEk5w/TpYY3D5cuhTp1QHlasGHUqSVmMBaKkrC9/fhg7Fi69FLZuhdat4bHHok4lSZIkZW//+x+ceiqsWgUNGoTbpUtHnUpSFmSBKCl7yJMHhg+Ha6+FeByuvhoeeCDqVJIkSVL29NprcMYZYamgU0+Ft9+GokWjTiUpi7JAlJR9JCTA4MHQo0e43a0b3H57KBQlSZIk7Z4xY8ISQRs3wjnnhDKxcOGoU0nKwiwQJWUvsRj07g19+oTbvXpB586QlhZpLEmSJClbeOIJuPhi2LIFWrWCF16AAgWiTiUpi7NAlJQ9de8ODz8czgcNgiuuCN8ESZIkSdqx/v2hffttSwKNGgV580adSlI2kOkF4n333UcsFqNz587p923YsIFrr72WEiVKULhwYVq0aMGyZcsyO4qknKZDh/BNT2IijBgBLVuGnZolSZIkbROPw513Qpcu4Xa3bvDII2GJIEnaDZn6bjFjxgwee+wxateuvd39N9xwA6+++iovvPACU6ZMYcmSJZx77rmZGUVSTnXJJWHaRb588OKLYQ2XdeuiTiVJkiRlDfE43Hgj3HVXuH3vvXDffWFpIEnaTZlWIK5Zs4ZWrVrxxBNPUKxYsfT7V69ezbBhw+jfvz+nnHIK9erVY/jw4Xz88cdMmzYts+JIysmaN4dXX4WkJJg4ERo3htTUqFNJkiRJ0dq6Fdq1gwEDwu1Bg+CWWywPJe2xTCsQr732Ws4880waNmy43f2zZs1i8+bN291fvXp19t9/f6ZOnbrD19q4cSOpqanbHZK0ndNPh0mTIDkZPvgATj0Vfv016lSSJElSNDZtCpulDBsWpioPHw6dOkWdSlI2lSkF4pgxY5g9ezZ9/twl9S+WLl1Kvnz5KFq06Hb3lylThqVLl+7w9fr06UNKSkr6UbFixcyILSm7O/ZYmDwZSpaEmTPhxBNhyZKoU0mSJEn71vr1YZbO2LFhk5SxY6Ft26hTScrGMrxAXLx4Mddffz2jR4+mQAZtBd+jRw9Wr16dfixevDhDXldSDlS3Lrz/Puy3H8yZA8cfDwsWRJ1KkiRJ2jdSU+GMM+CNN8ISPxMmQIsWUaeSlM1leIE4a9Ysli9fzuGHH06ePHnIkycPU6ZMYdCgQeTJk4cyZcqwadMmVq1atd3nLVu2jLJly+7wNfPnz09ycvJ2hyTtVI0aYRrzAQfADz+EEvGbb6JOJUmSJGWu336Dhg1hyhQoUgTeeiusDy5J/1GGF4innnoqX375JZ999ln6Ub9+fVq1apV+njdvXt599930z5k3bx4//vgjDRo0yOg4knKrKlVCiVizJvz8cygRP/006lSSJElS5vjlFzjpJJgxA0qUgPfeC98DS1IGyJPRL1ikSBFq1aq13X2FChWiRIkS6fdfccUV3HjjjRQvXpzk5GQ6depEgwYNOProozM6jqTcrHz5cPW1cWOYNQtOPhlefz2slShJkiTlFIsWhZGH330H5crBO++EC+mSlEEybRfmXXnooYc466yzaNGiBSeccAJly5blpZdeiiKKpJyuZMltV19Xr962W7MkSZKUE8ybB8cdF8rDypXhww8tDyVluFg8Ho9HHWJPpaamkpKSwurVq10PUdLuWbcuLB49cSLkywdjxoSd6SRJkqTs6rPPwgXyFSugevUw8nC//aJOJSmb2JN+LZIRiJK0zxUsCK+8EkrETZvg/PPhmWeiTiVJkiTtnalTw5qHK1ZA3brw/vuWh5IyjQWipNzjz5GHbdvC1q1wySXw6KNRp5IkSZL2zLvvwmmnhSV6jj02LNlTqlTUqSTlYBaIknKXPHlg2DC47rpwu0MHuO++aDNJkiRJu2vCBGjSBNauDdOX33oLihaNOpWkHM4CUVLuk5AAAwbAbbeF2z16wC23QPZbElaSJEm5ybPPwrnnhiV5mjcPZWKhQlGnkpQLWCBKyp1iMbjnHrj//nC7Tx/o1AnS0qLNJUmSJO3IY49B69bbluIZOxby5486laRcwgJRUu7WrVtYBzEWg4cfhssugy1bok4lSZIkbfPAA3D11WHGTIcOMGJEWJpHkvYRC0RJuvrqsCNzYiKMGgUXXggbN0adSpIkSbldPA633x4uekNYemfIkLAkjyTtQ77rSBLAxRfDuHFhp+aXXoKzzw4LU0uSJElRSEuD66+HXr3C7T59oHfvMHNGkvYxC0RJ+tM558Drr0PBgvD229CoEaxeHXUqSZIk5TZbtsAVV8DgweH2ww9D9+7RZpKUq1kgStJfNWwIkyZBSgp89BGccgqsWBF1KkmSJOUWmzZBy5ZhncOEBBg5Mqx7KEkRskCUpL875hiYPBlKlYLZs+HEE+Hnn6NOJUmSpJxu3bowK+bFF8PSOi++CJdeGnUqSbJAlKQdqlMHPvgAKlSAuXPh+OPhhx+iTiVJkqScKjUVGjeGiRMhKQlefRWaN486lSQBFoiStHMHHwwffggHHggLFsBxx8GcOVGnkiRJUk7z669w6qnhAnZycliP+/TTo04lSeksECVpVypVCt/I1aoFv/wCJ5wAs2ZFnUqSJEk5xZIlYcmcmTOhZEn43//ChWtJykIsECXp35QrF9ZEPOII+O23sLHKBx9EnUqSJEnZ3YIFYamcOXOgfHl4/304/PCoU0nSP1ggStLuKFEC3n03XB1OTYVGjeCtt6JOJUmSpOzqm2+2rbN9wAFh6ZwaNaJOJUk7ZIEoSburSBF4801o0gTWr4emTWHcuKhTSZIkKbuZPTuUhz//DDVrhtktVapEnUqSdsoCUZL2RFISjB8P558PmzfDBRfAyJFRp5IkSVJ28dFHcPLJYeOUevVgypQwfVmSsjALREnaU/nywXPPwRVXQFoatG0LQ4ZEnUqSJElZ3aRJYXfl1NQwAvHdd8PGKZKUxVkgStLeSEyEJ56Azp3D7U6d4M47Q6EoSZIk/d3zz8NZZ8G6ddC4MUycCCkpUaeSpN1igShJeysWg/794Y47wu277oLmzWH16mhzSZIkKevYsgVuugkuugg2bYIWLeCVV6BgwaiTSdJus0CUpP8iFgsjD598EvLnhwkT4Igj4Kuvok4mSZKkqC1fDqedBv36hdvdusGYMWFJHEnKRiwQJSkjXHEFfPgh7L8/fPstHH00jB0bdSpJkiRFZfp0OPxwmDwZCheGF1+E+++HPHmiTiZJe8wCUZIySv36MGsWnHoqrF0LF14IXbqEaSuSJEnKHeJxeOwxOOEE+PlnOPhg+OSTMHVZkrIpC0RJykglS4YFsW++Odzu3z9MW1m+PNpckiRJynwbNsCVV8LVV4f1Dps3D+VhjRpRJ5Ok/8QCUZIyWp48cN99MG5cmK4yeXKYvjJtWtTJJEmSlFkWLYLjjoOnnoKEhG3fDyYnR51Mkv4zC0RJyiznnhuuOFevHqavnHBCmM4Sj0edTJIkSRlp0iSoVy8sZ1OiBLz1VpiREotFnUySMoQFoiRlpho1Qol47rmweXOYznLFFbB+fdTJJEmS9F/F42GkYePG8Ntv20rEhg2jTiZJGcoCUZIyW5EiYde9++4L01mGDw/TWxYtijqZJEmS9lZqatgYpUcPSEuDyy+HDz+ESpWiTiZJGc4CUZL2hVgsTGN5++0wrWX27HCFetKkqJNJkiRpT82dC0ceCePHQ968YZmaJ5+EAgWiTiZJmcICUZL2pVNPDeVh/fphmkvjxmFkousiSpIkZQ/jxoXycN482G8/+OADaN/e9Q4l5WgWiJK0r+2/f/hG84orwnSXHj3C9JfU1KiTSZIkaWe2bIFu3eC882DNGjjppHBh+Kijok4mSZnOAlGSolCgQJjm8vjjkC9fmP5y5JEwZ07UySRJkvR3K1ZAo0bwwAPhdpcuYSma0qWjzSVJ+4gFoiRFqV27MBqxQoUwDeaoo8K0GEmSJGUNM2aEtavfew8KFYLnn4cHH4Q8eaJOJkn7jAWiJEXtyCNh1iw4+eQwHea888L0mC1bok4mSZKUuz35JBx3HCxeDFWrwvTpcMEFUaeSpH3OAlGSsoLSpcMOzV27htsPPBCmyaxYEW0uSZKk3GjjxrAxSrt2sGkTnHNOGIl4yCFRJ5OkSFggSlJWkScP9O0LY8eG6THvvRemy8yYEXUySZKk3GPxYjj+eHjiibCz8r33wksvQUpK1MkkKTIWiJKU1Zx/PnzyCVSrFr6BPe64MH1GkiRJmeu99+Dww8MF3OLF4c034ZZbIMEfnSXlbr4LSlJWVLNmKBGbNQvTZtq1C8eGDVEnkyRJynni8bCEzGmnwa+/Qt26MHNmWFJGkmSBKElZVkpK2JG5d+8wfebJJ+GEE8KoREmSJGWMP/4IG6N06wZpadCmDXz0EVSpEnUyScoyLBAlKStLSIAePWDixDCNZsaMMK3mvfeiTiZJkpT9zZsHRx0FL74IefPCI4/A8OGQlBR1MknKUiwQJSk7OP10mDUrlIe//hqm1zzwQJhuI0mSpD03fjwccQTMnQvly8OUKXDNNWHmhyRpOxaIkpRdVK4MH34IbduG6TXduoXpNn/8EXUySZKk7GPr1rAxyrnnhu+jTjghXKht0CDqZJKUZVkgSlJ2kpQETz0Fjz4aptm8+GKYdvPNN1EnkyRJyvp+/RXOOAP69Am3b7gB3nkHypaNNpckZXEWiJKU3cRicPXV8P77sN9+YdrNkUeGaTiSJEnasdmzoX59mDQJChaEZ5+F/v3DRVlJ0i5ZIEpSdnX00WG6zYknhuk3554bpuNs3Rp1MkmSpKxl+HA45hhYtAgOOgimTYOWLaNOJUnZhgWiJGVnZcqEq+g33hhu9+kTpuX8+mu0uSRJkrKCjRvDxiiXXx7OzzoLZsyAQw+NOpkkZSsWiJKU3eXNC/36wZgxYTrOpElhes6sWVEnkyRJis5PP4WZGkOHhiVg7r4bXnkFihaNOpkkZTsWiJKUU1x4IUyfDlWrhuk5xx4bputIkiTlNpMnQ7164XujokXh9dfh9tshwR+BJWlv+O4pSTlJrVphWs7ZZ4dpOpdfHjZc2bgx6mSSJEmZLx4PG6M0bAjLl8Nhh4VZGWecEXUyScrWLBAlKadJSQk7Mt9zT5iu89hjYfrOTz9FnUySJCnzrFkTNkbp0iVsKte6NXz8MRxwQNTJJCnbs0CUpJwoIQFuuw3eeAOKFQvTd+rVC9N5JEmScppvv4Wjj4bnn4c8eWDwYBg1KqwPLUn6zywQJSkna9wYZs6EOnXCNJ6GDcO0nng86mSSJEn/yag351CsxmxG3ftM2EDu66+hXLlwwbRjxzATQ5KUISwQJSmnO+AA+OgjuOSSMJ2nS5cwvWfNmqiTSZIk7bV+jy5n1TeH0/+J3yA1FY47Lqx3eOyxUUeTpBwnT9QBJEn7QMGCMHIkHHUUdO4cpvd89RW89BJUqxZ1OkmSpN3y0Rc/sWDJH8TWruHLd2sC8MWKixh98VLiF19MlRVbObZcxCElKQeKxePZbx5bamoqKSkprF69muTk5KjjSFL28vHHcN558MsvkJwMTz8ddm2WJEnK4raflRwHYkAaf51cl/1+wpWkaOxJv+YUZknKbY45BmbPhuOPD9N9zjkHbr89TG+WJEnKwq66ZDjE/vye5c828f9/rE3YzDW9P4oiliTleBaIkpQblS0L774L118fbvfqBWeeCb//Hm0uSZKkHdm0ia9b9mLW07UgnrjDpzzzxnc80sP1DyUpM1ggSlJulTcvDBgAo0dDUhK89VbYwfDTT6NOJkmSlG7Lj0u4v+qTHD6mKzM5goL51v//I1v/9lGSlFksECUpt7v4Ypg2DQ48EBYsCFOcR42KOpUkSRJpUz7gtIMW0P3HDmwiP03qL2Ps26tJKLKcgpW+4eIe71Ow0jckFFlOtf2LRh1XknIsC0RJEtSuDTNmhGnMGzZAmzZw7bWwaVPUySRJUm4Uj8PAgSQ0PIUzN48nOeEPht+3jNc+KcOZJ5Zl5S8p/PFDTUb3PoE/fqjJyl9SOKKG2y9LUmaxQJQkBcWKwYQJcNddYYvDRx6Bk06CJUuiTiZJknKRbz9fx2dn3gqdO8OWLdxw0VLmzkuk7c1l0ndhTi6Un4SEcCMhIUZyofzRBZakXMACUZK0TUIC9OwJr70GRYvC1Klw+OHw/vtRJ5MkSTlcWhoMun0Fh9WNcdGbl7I+sTAMGEDis09T/qCCUceTpFzNAlGS9E9NmsDMmWFq87JlcMopMHBgmE4kSZKUwX74AU4+7Deu71WK9fEk9su3gtRxk+D660kfdihJiowFoiRpxw48MIxAbNUKtm4N04hat4a1a6NOJkmScoi0NHjk4TRqV9/E+1+VoBBreKTKA0z6/kDKnHN01PEkSf/PAlGStHMFC8LTT8OgQZAnDzz7LDRoAN99F3UySZKUzaWmwmknb+bajgms3ZyPE5nMF60f4JpvriehQvmo40mS/sICUZK0a7EYdOoE//sflC0LX34J9erBo4+GYQOSJEl7ocj7r5Pnk49JYh2D8tzIe8N/5ICn74J8+aKOJkn6GwtESdLuOe44mD07fExNhQ4dwvlXX0WdTJIkZRM//QSp85fCBRcQa3oWwza04vOKTen0ySUktL006niSpJ2wQJQk7b5y5WDyZBgyBIoUCWsk1q0Lt9wC69dHnU6SJGVR8TiMeCqNQ6pupEutt+CFFyAxkQpdL6bq3Anh+wlJUpZlgShJ2jOJiXDttTB3Lpx7LmzZAn36wKGHwjvvRJ1OkiRlMUuWQNOTUrnsigRSN+Tnq83VWF/vOJg5E/r2hUKFoo4oSfoXFoiSpL2z334wbhy88gpUqADffw+nnQaXXAIrVkSdTpIkRSweh2ee2sQhB67n9feTycdG7s93Ox8OmEXS9MlQp07UESVJu8kCUZL035x9NsyZA9ddFzZceeYZqF4dhg8PPzlIkqRcZ8UKaH7cCi65Ih+rNiRRnxnMPqUr3b6/isTrO4YZDZKkbMMCUZL03xUpAgMHwvTpYTTB77/D5ZfDKafA/PlRp5MkSfvSr79Cx458/HGcvGzi3uT7mPrCzxzy7qAwa0GSlO1keIHYp08fjjjiCIoUKULp0qVp1qwZ8+bN2+45GzZs4Nprr6VEiRIULlyYFi1asGzZsoyOIkna1444AmbMgAcegIIFw4Yrhx4Kd98NGzdGnU6SJGWi1aviMHIkVK9OqbEP8yytmHlRP25Z3IE85zWLOp4k6T/I8AJxypQpXHvttUybNo1JkyaxefNmTj/9dNauXZv+nBtuuIFXX32VF154gSlTprBkyRLOPffcjI4iSYpCnjxw003w9ddwxhmwaRPccUfYXfGDD6JOJ0mSMsG4Ib9QtfQqxrZ9HX77DWrXpuG0XtR+rgckJ0cdT5L0H8Xi8cxdoGrFihWULl2aKVOmcMIJJ7B69WpKlSrFs88+y3nnnQfAN998Q40aNZg6dSpHH330v75mamoqKSkprF69mmT/M5KkrCseh7Fj4frr4c+R5u3awf33Q7Fi0WaTJEn/2W+/bKJjo28Z8+UhAJycMJl3e39C7MYbIG/eiNNJknZlT/q1TF8DcfXq1QAUL14cgFmzZrF582YaNmyY/pzq1auz//77M3Xq1B2+xsaNG0lNTd3ukCRlA7EYXHghzJ0L7duH+554AmrUgDFj3GRFkqRs7JU+czikYipjvjyERLZw6wHP8eZX+xO7uZvloSTlMJlaIKalpdG5c2eOPfZYatWqBcDSpUvJly8fRYsW3e65ZcqUYenSpTt8nT59+pCSkpJ+VKxYMTNjS5IyWrFi8NhjYQpzjRphNGLLltCkCSxYEHU6SZK0B1YuWMWl1abS7JaaLNtakpqJ3zD1nnfp9d1F5K9xQNTxJEmZIFMLxGuvvZavvvqKMWPG/KfX6dGjB6tXr04/Fi9enEEJJUn71HHHwaefhk1V8ueHiRPhkEPCpitbtkSdTpIk7Uo8Ds8/z6zD2/H0tw1IYCs3136TWT+W5ojbGoWZB5KkHCnTCsSOHTvy2muv8b///Y8KFSqk31+2bFk2bdrEqlWrtnv+smXLKFu27A5fK3/+/CQnJ293SJKyqfz54fbb4Ysv4OSTYf166NYN6tcPOzhLkqQsJ+2HhXDWWXDRRTRc9SK9Sg7gw4e/4L7Pz6BA+eJRx5MkZbIMLxDj8TgdO3Zk/PjxvPfee1SpUmW7x+vVq0fevHl599130++bN28eP/74Iw0aNMjoOJKkrKpaNXj3XRg+HIoXh88/h6OOguuugz/+iDqdJEkC2LKFt9u/SO2D1rHoja8gXz64805u/ekaGnSoG3U6SdI+kuG7MHfo0IFnn32WV155hYMPPjj9/pSUFJKSkgC45ppreOONNxgxYgTJycl06tQJgI8//ni3voa7MEtSDrNiBXTpAk8/HW7vtx8MGQLNmkUaS5Kk3OyPKbO5qcUCHv+tBQCXlX2Dp/53AFSvHnEySVJG2JN+LcMLxNhO1r0YPnw4bdu2BWDDhg106dKF5557jo0bN9KoUSMeeeSRnU5h/jsLREnKod55B66+Gr7/Ptxu1gwGD4a/LIUhSZIy2R9/8F7bUVz+0pksojIA1536Nb1frkmhwq5zKEk5RaQF4r5ggShJOdj69dCrF/TtGzZWKVIE7r0XOnSAxMSo00mSlKOtef51ul+xgofXtgWgSuHlPDUqLyc1LxZtMElShtuTfi1Td2GWJGmPJSWFwvDTT6FBg7Ae4nXXwTHHhI1XJElSxvv5Z2jRgkEXfZReHnZo+iNf/FLa8lCSlLNHIG7dupXNmzfvw2Ta1/LmzUuiI5KknCstDR57DLp3h9TUMAKxSxe44w4oWDDqdJIkZX9bt8LQodCjB/zxBxsSCtK80my6DKpEw7MKRJ1OkpSJcv0U5ng8ztKlS1m1atW+D6d9rmjRopQtW3an629KygGWLIHrr4cXXwy3q1SBRx+FRo2izSVJUnb2xRd81HIIj8w5kVFcSuJRR8Djj0Pt2lEnkyTtA3tSIObZR5n2qT/Lw9KlS1OwYEGLpRwqHo+zbt06li9fDkC5cuUiTiQp05QvDy+8AK+9FtZCXLAAGjeGli3hoYegTJmoE0qSlH2sW8f623tz+0PF6R8fSpwEjmyxP9c/f4zrDUuSdijHjUDcunUr8+fPp3Tp0pQoUSKihNqXfvvtN5YvX061atWczizlBmvWQM+eMHBgmOJcrFjYcOXyyyHBpX0lSdqlt99m+mVDabOkN/OoDkDbC9by0GOFKFo02miSpH0rV2+i8ueahwVdGyvX+PPP2vUupVyicGHo3x8++QTq1oWVK6FdOzjpJJg7N+p0kiRlTcuXs+GitnRvNJtjlrzAPKpTttgGXn0Vhj9veShJ2rUcVyD+yWnLuYd/1lIuVa9eKBH79QsbqnzwARx2WNhgZcOGqNNJkhS5Ue/MpFjnUxjVsx9Ur06750/lfrqTRiKtL9zM198V4Kyzok4pScoOcmyBKEnKBfLkgRtvhDlz4MwzYfNmuPtuqFMHpkyJOp0kSZHq9/oTrCr2P/rPmAArV9L94JepWGYjL70ET4/JS/HiUSeUJGUXOXITFUlSLlOpErz6atil+brrYN68MKX58svhgQfwJyRJUm7x0deLWPDTL8RefZUvk14C4Itacxhd8y7ijRrxdOmlnFinUsQpJUnZjSMQs5lLLrmE3r1779HnTJw4kTp16pCWlpZJqSQpC4jF4PzzwzqIV18d7nvqKaheHUaPhuy3Z5gkSXvsuBcrc8m0BrQu1Zt4oV8BiBf6jdbJd3DJ1KM56ZXK0QaUJGVLFohZQDwep2HDhjRq1Ogfjz3yyCMULVqUn376ic8//5w33niD6667DoC1a9dy4IEHcuONN273OQsXLiQ5OZknnngCgMaNG5M3b15Gjx6d+b8YSYpa0aLw6KPw0UdwyCGwYgW0bg2NG8P330edTpKkzPH776xt14Yjv64If14z+3Op8Nj/37E1D9eUeSaKdJKkbM4CMQuIxWIMHz6c6dOn89hjj6Xfv2DBArp168bgwYOpUKECgwcP5vzzz6dw4cIAFCpUiOHDhzN48GA++OADIJSRl112Gcceeyzt2rVLf622bdsyaNCgffsLk6QoHXMMzJ4NvXpB/vzw9ttQqxbcd19YK1GSpJwgHmfz6FE8el4lDiw6ik8OWbytOPybZ06aziNXt9q3+SRJOULuKBDjcVi7dt8fezBdrmLFigwcOJCbbrqJBQsWEI/HueKKKzj99NO55JJL2Lp1Ky+++CJNmzbd7vNOOOEEOnXqxGWXXcbatWsZOHAgn332GU8++eR2z2vatCkzZ87ke0ffSMpN8uWDW2+FL7+EU04JuzP36BF2cJ42Lep0kiT9Nz/8wJst61Nzehs6nLiGZYXhgKTyXFv9/5c8SkvY/qMkSXspd/xPsm4dFC6874916/YoZps2bTj11FO5/PLLGTJkCF999VX6iMQvvviC1atXU79+/X983r333kuePHlo3bo1t9xyC4MHD2a//fbb7jn7778/ZcqUSR+pKEm5StWq8M47MHIklCgRCsVjjoGOHSE1Nep0kiTtmc2boW9fqFWLlXNm810JKEUhBp/2EHO7LKBNnUtIWFeWgqn1uDh5KAVT65GwrizV9isddXJJUjblLsxZzOOPP84hhxzC+++/z7hx4yhVqhQAixYtIjExkdKl//mfflJSEgMHDqRx48acccYZtG7deoevXb58eRYtWpSp+SUpy4rF4NJLoUkTuOmmUCY+/DCMHw+DB0Pz5uE5kiRlYZ9OeppfHuhJk0kLAbio5EmsrHcCl552E0XyFwHgiIMrsLLnQgon5SMhIUZaWnvWrN9EcqH8ESaXJGVnuaNALFgQ1qyJ5uvuodKlS3PVVVfx8ssv06xZs/T7169fT/78+Ynt5IfbYcOGUbBgQb788ktWr15NSkrKP56TlJTEuj0cFSlJOU7JkjBiRCgTr7oKvvsOWrSAs8+GIUOgYsWoE0qS9A8//Pg5tz96Ac8WmE/Z2vDd58UodH9/Etq04dod/Izw17IwISFmeShJ+k9yxxTmWAwKFdr3x16OZMmTJw958mzf7ZYsWZJ169axadOmfzz/+eef57XXXuPjjz+mSJEi3HDDDTt83d9//z19RKMk5XqnnBKmMt92G+TNCxMmQM2aMHAgbN0adTpJkgBYsXYF1w85i+pP1uHZAvMBOJnKrP3kQ2jb1tHzkqR9IncUiDlAnTp1AJgzZ8529y9btoxrr72WXr16cdhhhzFixAhGjRrFm2++ud3zNmzYwPfff0/dunX3VWRJyvoKFIB77oFPP4Vjjw2j1Tt3hqOPDvdJkhSRNZvWcPerN3HA/eUY9NvrbE6E05ckMfuwR3n2wQWUrlQz6oiSpFzEAjGbKFWqFIcffjgffvjhdve3b9+eGjVq0LlzZwCOPPJIunbtSvv27Vm9enX686ZNm0b+/Plp0KDBvowtSdnDIYfA++/D0KGQkgIzZ8IRR4S1EteujTqdJCm32bqVb4bcyR2z+7EmcSv1lsCkzS15a8Bv1G12ddTpJEm5kAViNnLllVcyevTo9NujRo3inXfeYfjw4SQkbPujvOuuuyhatOh2U5mfe+45WrVqRcG9WJdRknKFhISwJuLcuXDBBWEac79+oVwcMQJ2sISEJEkZJS2exme/fApvvglHH039Lv246SN4/rOqfNLxcxr2ehaSkqKOKUnKpWLxeDwedYg9lZqaSkpKCqtXryY5OXm7xzZs2MCCBQuoUqUKBQoUiChh5li/fj0HH3wwzz///B6NJPz11185+OCDmTlzJlWqVMnEhNHIyX/mkiL0xhvQoQP8uXt9xYrQpQtceWVY51aSpAzyzrdvcfO4a/hq3ULmD4pTaTWQnAz33w/t24eLXJIkZbBd9Wt/5/9E2UhSUhKjRo3i119/3aPPW7hwIY888kiOLA8lKdM0aQJffw19+0LZsrB4cVgfsXLlsG7iypVRJ5QkZXOzF07l9D41Oe3ZxszeuIB8W+J8Vjl/uGD1zTdw9dWWh5KkLMERiMr2/DOXlOk2bICRI0OZ+MMP4b7ChcMPdjfcAOXLR5tPkpStfL/4c24b2YYxWz8HIO9W6PBlAW6tcx2lOt0MxYtHnFCSlBs4AlGSpIxUoEBYH3HePHjuOahdO+zY/OCDUKVKmF723XdRp5QkZXUrVrDu9u7Uf6QuY7Z+TiwOrb4ryLyitzPgmV8pdcf9loeSpCzJAlGSpN2VJw9cdBF89hm8/jocd1zYXOWJJ+Dgg7c9JknSX6z/YT5cfz1UqkTBXvfTcXqcxksKMbvcnTwzbCVVbrzb9XUlSVmaBaIkSXsqFgtrJH7wQTjOPBPS0uD556Fu3fDY++9D9lslRJKUgTZ99TlDOh1F5UcPZsorg2D9eqhXjzs7PM+bj6ymzlV3QL58UceUJOlfWSBKkvRfHHccvPYafP45tGwZFrt/80048cRtj1kkSlKukvbJdMZcfiQ1nqhDp5KfsLwwDD2zNEyaBDNmkHjeBZCYGHVMSZJ2mwWiJEkZoXZtePZZmD8/rJeYLx98/DE0bQqHHRYe27Il6pSSpMwSj8M77zDpvLrUf+poWlaawQ/Foczm/Dx6yM2MGvQTNGwYRrFLkpTNWCBKkpSRDjwQhg6FhQuhWzcoUgS+/BJatYJq1eDRR8OuzpKknCEtDV56CY48kisGn8bph37Gp+WgSFpeetW6ju97/sbV591H3sS8USeVJGmvWSBKkpQZypWD+++HH3+EXr2gZElYsAA6dIDKlcNjqalRp5Qk7a1Nm2DECDjkEGjRAmbO5OSf85IvnkDnmpfzw81LuLXFQArlc3MUSVL2Z4GofaZy5coMGDAg6hiStG8VLQq33gqLFsGgQbD//rBsGXTvHs5vuQWWL486pSRpF2YumckpI09h5pKZsHYtDBzIslpV6PjCZTyV9A2kpMCtt3LxG4v59oYFPHT+MEoWLBl1bEmSMowF4i5s941ChNq2bUuzZs0y7PVOOukkOnfunGGvt7tmzJhB+/btd/v5kydPJhaLsWrVqswLJUn7SsGC0KkTfPcdjBwJNWrA6tXQpw9UqgQdO4Zpz5KkLGfU56P438L/8fQTnUg9qCJ3vNyZA89fwsNHwm3NirDhh/nQqxcJpcuwf8r+UceVJCnDWSDuQvo3Cp8/HXWUDLFp06ZIv36pUqUoWLBgpBkkKXJ588Kll8JXX8H48XDkkWFNxIcfhoMOCo99/XXUKSUp11u0ahGzlsxi9hdv8fy0YQA8tXEaldqs5O6TYG0+OKJcPUZf8goFipeONqwkSZnMAvFv0r9R+GU2z3/9PABjvh7D7F9mM2vJLBatWpRpX/vFF1/k0EMPJSkpiRIlStCwYUO6du3KyJEjeeWVV4jFYsRiMSZPngzAzTffTLVq1ShYsCAHHHAAt99+O5s3b05/vTvvvJM6derw5JNPUqVKFQoUKEDbtm2ZMmUKAwcOTH+9hf8y4uXPkYCvv/46tWvXpkCBAhx99NF89dVX2z1v3LhxHHLIIeTPn5/KlSvTr1+/7R7/+xTmWCzGk08+SfPmzSlYsCBVq1ZlwoQJACxcuJCTTz4ZgGLFihGLxWjbtu3e/cZKUlaUkADNmsG0afDee3DaabB1Kzz9NNSqBeecEx6TJEWi8sDK1H+iPvXGN2ZFbB0Aa/LDqqRtz5nebgYnVzk5ooSSJO07eaIOkNVUHlg5/TxGDIAVa1dQ7/F66ffH74hn+Nf95ZdfaNmyJX379qV58+b88ccffPDBB1x66aX8+OOPpKamMnz4cACKFy8OQJEiRRgxYgTly5fnyy+/pF27dhQpUoRu3bqlv+53333HuHHjeOmll0hMTKRSpUrMnz+fWrVqcffddwNhZODu6Nq1KwMHDqRs2bLccsstNG3alPnz55M3b15mzZrFBRdcwJ133smFF17Ixx9/TIcOHShRosQui7+77rqLvn378sADDzB48GBatWrFokWLqFixIuPGjaNFixbMmzeP5ORkkpKSdvo6kpRtxWJw8snhmDkT7rsv7OY5YUI4TjoJevQIBWMsFnVaScr5PvsM7ruPZ+bGaHtOnC2JEP/b22+ehDyMOGcEMd+XJUm5hCMQ/+aZ5s+QJyH0qnHi233Mk5CHZ5o/kylf95dffmHLli2ce+65VK5cmUMPPZQOHTpQuHBhkpKSyJ8/P2XLlqVs2bLky5cPgNtuu41jjjmGypUr07RpU2666SbGjh273etu2rSJUaNGUbduXWrXrk1KSgr58uWjYMGC6a+XmJi4WxnvuOMOTjvtNA499FBGjhzJsmXLGD9+PAD9+/fn1FNP5fbbb6datWq0bduWjh078sADD+zyNdu2bUvLli056KCD6N27N2vWrOGTTz4hMTExvSgtXbo0ZcuWJSUlZU9/WyUpe6lfH158EebMgcsvD9OdJ0+GRo3CYy+8EEYpSpIyVjwO778PZ5wBdevC88/T6os40785bodPn37ldFrVbrWPQ0qSFB0LxL9pVbsV06+cvsPHMvMbhcMOO4xTTz2VQw89lPPPP58nnniClStX7vJznn/+eY499ljKli1L4cKFue222/jxxx+3e06lSpV2e4Thv2nQoEH6efHixTn44IOZO3cuAHPnzuXYY4/d7vnHHnss3377LVt38cNu7dq1088LFSpEcnIyy92NVFJuV706DBsG338PnTuHDVhmz4YLLoCaNcNjEa9rK0k5QjwOr70Gxx0HJ54IEyeGJSZatoTPP4eBAwFI+P8fmxL88UmSlEv5P+Au7MtvFBITE5k0aRJvvvkmNWvWZPDgwRx88MEsWLBgh8+fOnUqrVq1okmTJrz22mt8+umn3Hrrrf/YKKVQoUKZnv2/yJs373a3Y7EYaWlpEaWRpCymYkV46CFYtAh69oRixWD+fLjySjjgAOjfH9asiTqlJGU/W7bA6NFQuzY0bQoffwz58sFVV4X32Wefhdq1KV2oNGULl6Ve+XoMPXMo9crXo2zhspQu5KYpkqTcxTUQd+DPbxQqJlfkirpXMOzTYSxOXZzp3yjEYjGOPfZYjj32WHr27EmlSpUYP348+fLl+8covo8//phKlSpx6623pt+3aNHubfCyo9fbHdOmTWP//fcHYOXKlcyfP58aNWoAUKNGDT766KPtnv/RRx9RrVq13Z4ivaOcwF5llaQcpWRJuOsu6NoVHn8c+vWDn3+GLl3g3nuhU6dwlCgRdVJJyto2bIDhw+GBB+DPC/VFisA114QR3+XKbff0CskVWHj9QvIl5iMWi9G+Xns2bd1E/jz59312SZIiZIG4A1F8ozB9+nTeffddTj/9dEqXLs306dNZsWIFNWrUYMOGDbz11lvMmzePEiVKkJKSQtWqVfnxxx8ZM2YMRxxxBK+//nr6eoT/pnLlykyfPp2FCxdSuHBhihcvTkLCv4+yvPvuuylRogRlypTh1ltvpWTJkjRr1gyALl26cMQRR3DPPfdw4YUXMnXqVIYMGcIjjzyy178nlSpVIhaL8dprr9GkSROSkpIoXLjwXr+eJGV7hQvDjTfCtdeG3Zr79oVvvw3l4oMPQvv24fEKFaJOKklZy+rV8OijMGAALFsW7itZMpSGHTqEEd478defAWKxmOWhJClXcgrzTuTPkz99V7V98Y1CcnIy77//Pk2aNKFatWrcdttt9OvXjzPOOIN27dpx8MEHU79+fUqVKsVHH33E2WefzQ033EDHjh2pU6cOH3/8Mbfffvtufa2bbrqJxMREatasSalSpf6xbuLO3HfffVx//fXUq1ePpUuX8uqrr6aPEjz88MMZO3YsY8aMoVatWvTs2ZO77757lzsw/5v99tuPu+66i+7du1OmTBk6duy4168lSTlK/vxhGvPcuTB2bFjwf+3aMN35gAPgiivCFDxJyu2WL4dbboFKlcKO9suWwf77w6BBYXmIW2/dZXkoSZKCWDwej0cdYk+lpqaSkpLC6tWrSU5O3u6xDRs2sGDBAqpUqUKBAgUiSpizTJ48mZNPPpmVK1dStGjRqOP8g3/mknK9eBzefhv69IEpU8J9sRi0aAHdu0O9etHmk6R9beHCMDJ72LAwbRmgRo3wntiyZdjlXpKkXG5X/drfOQJRkqTsLhaDRo1g8uSwEUDTpqFUfPFFqF8fTj8d/ve/cJ8k5WRffw2XXgoHHQQPPxzKwyOPhPHj4auvwmOWh5Ik7TELRHH11VdTuHDhHR5XX3111PEkSXuiQQOYMAG+/BJat4bERJg0CU45JTz2yivgbveScppp0+Ccc6BWrbBG7NatcNpp8N574bFmzWA31vyWJEk75hRmsXz5clJTU3f4WHJyMqVLZ+7u0/+Vf+aStAsLFoRpfE89tW0aX82acPPNTuOTlL3F4+ECSZ8+YQQ2hBHZ554bpirXrx9pPEmSsro9mcJsgahszz9zSdoNy5aF3UcfeQT+vGhUqRLcdBNcfjkULBhpPEnabVu3wksvwX33wezZ4b48eeCSS6BbN6hePdp8kiRlE66BKEmStlemTBil8+OP4WPp0mEH0k6doHJl6N0bVq2KOqUk7dymTWFTlJo14YILQnlYsCB07gw//BBGWlseSpKUKSwQJUnKTVJSwtS+hQvDBgOVK8OKFXDrrbD//nDNNWFH502bok4qSWHN1unToUcPOOAAuPJKmD8fihWDnj3DhZCHHoKKFaNOKklSjmaBKElSbpSUBB06wLffwjPPhI0H/vgDhg4NOzqXLg2tWoWdnNesiTqtpNxk8+awtmGHDqEYPProMF3555+hfHno1y8Uh3fdBSVLRp1WkqRcIU/UASRJUoTy5AlFYcuW8O67oTB85ZWwZuKzz4Yjf/6wm2mzZnD22VCqVNSpJeU0a9bAW2/B+PHw2muwevW2x4oUgSZNoHnz8D6UP39kMSVJyq0sECVJEiQkhJLwtNPg0Udh2jR4+eXww/x334Uf6F97LTzv2GO3/SBfpUrUySVlVytWwKuvhveat9+GjRu3PVa6NJxzTnivOeUUS0NJkiLmLszK9vwzl6RMFI/DnDmhSHz5ZZg1a/vHDztsW5lYuzbEYlGklJRdLFy47eLEhx+GNQ7/dOCB295Pjj4aEhMjCilJUu6wJ7swWyDuwsyZ0K0b9O0L9ev/p5fKMRYuXEiVKlX49NNPqVOnTtRxAAtESdqnfvwx/PD/8svw/vuwdeu2x6pUCT/4N28OxxzjD/+SwkWIL7/cdhHis8+2f/zww7e9bxxyiBchJEnah/akQHQK8y6MGgX/+x88/XTWLBA3bdpEvnz5oo4hScpN9t8frrsuHL/9FqY1jx8f1i5bsCDshvrQQ2GdxLPPDsVAw4bgBR4p99i6FaZO3VYa/vDDtscSEuCEE8J7Q7NmUKlSRCElSdKeyFW7MK9du/Njw4bwnEWLwuysjz6CMWPCfc89F25/+CHMnQvr1//76+6pk046iY4dO9KxY0dSUlIoWbIkt99+O38dIFq5cmXuueceLr30UpKTk2nfvj0AH374IccffzxJSUlUrFiR6667jrX/H+KWW27hqKOO+sfXO+yww7j77rt3mGXlypW0atWKUqVKkZSURNWqVRk+fDgAVf5/rau6desSi8U46aST0j/vySefpEaNGhQoUIDq1avzyCOPpD+2cOFCYrEYY8aM4ZhjjqFAgQLUqlWLKVOm7PlvliQpayhRAtq0CQXBr7/CSy/BpZdCsWJhbbNhw6Bp07BL6vnnhw1ZVq2KOrWkzLBhA7z+OrRrF3ZKPv546N8/lIcFCoQLCsOHhw2a/vc/uP56y0NJkrKRXDWFeVczIpo0Cd/z7M6siRNPhMmTt90uVSr83PRXe/q7etJJJzFr1iyuuOIKrrnmGmbOnEn79u0ZMGAA7dq1A0KBuHLlSnr27EmzZs3SP/ewww6jV69enHnmmaxYsYKOHTty2GGHMXz4cL7++mtq1arFd999x4EHHgiQft+3337LQQcd9I8sHTt25KOPPuKJJ56gZMmSfPfdd6xfv56mTZsyY8YMjjzySN555x0OOeQQ8uXLR/HixRk9ejRdu3ZlyJAh1K1bl08//ZR27drRv39/2rRpkz71uUKFCgwYMICaNWvSv39/nn/+eRYsWECJEiX27DfsL5zCLElZzObNYXrzn1Odf/pp22N588LJJ4eRR+ecE4oGSdnT6tXwxhthpOGbb4adlP9UtCicdVaYmtyoERQqFFlMSZK0Y66B+B8KxNGjoW1b2LJl58/NrAJx+fLlfP3118T+P2j37t2ZMGECc+bMAUKBWLduXcaPH5/+eVdeeSWJiYk89thj6fd9+OGHnHjiiaxdu5YCBQpQp04dWrRowe233w6EUYnvvfce06ZN22GWs88+m5IlS/LUU0/947GdrYF40EEHcc8999CyZcv0+3r16sUbb7zBxx9/nP559913HzfffDMAW7ZsoUqVKnTq1Ilu3brt2W/YX1ggSlIWFo+Hof1/TmX8///T0h11VCgYmjeHatUiiShpD/zyC7zySvj3/N574YLBn/bbb9vU5BNPDBcMJElSluUaiDvx14uif/fnOu+tWkGNGlCv3j+f8+GHUKdOWLrlrxYuzJh8Rx99dHp5CNCgQQP69evH1q1bSfz/gPX/thjj559/zhdffMHo0aPT74vH46SlpbFgwQJq1KhBq1ateOqpp9KnRD/33HPceOONO81xzTXX0KJFC2bPns3pp59Os2bNOOaYY3b6/LVr1/L9999zxRVXpI+WhFAQpqSkbPfcBg0apJ/nyZOH+vXrM3fu3H/5nZEkZVuxWFhIuH59uPdemD9/W5k4bRpMnx6O7t3Df8B/7sBav76bKUhZxbffhn+348eHf7d/Vb36tosA9er98xtlSZKUI+SqAnFPZ04kJEBa2raPSUk7fo19OSOj0N++2Jo1a7jqqqu47rrr/vHc/fffH4CWLVty8803M3v2bNavX8/ixYu58MILd/o1zjjjDBYtWsQbb7zBpEmTOPXUU7n22mt58MEHd/j8Nf/fzD7xxBP/WG8x0R04JUl/Va0a3HxzOJYsgQkTQinx3nthoeG5c6F3b6hQIUxxbt48bLjgSCZp3/lz5PDLL4d/nzsaOfznSMPq1SMIKEmS9rVcVSDurtKloWxZqFgRrrgirAG/eHG4PzNNnz59u9vTpk2jatWquyzhDj/8cObMmbPDtQz/VKFCBU488URGjx7N+vXrOe200yj9L7+YUqVK0aZNG9q0acPxxx9P165defDBB9N3fd66dWv6c8uUKUP58uX54YcfaNWq1S5fd9q0aZxwwglAGKE4a9YsOnbsuMvPkSTlUOXLw9VXh2PVqrCW2ssvh48//QQPPxyOYsXCWmrNmrmWmpRZNm+GDz7YNkL4r2uX5skT1i5t3jxshrLffpHFlCRJ0bBA3IEKFcK05Hz5wuyp9u1h0ybInz9zv+6PP/7IjTfeyFVXXcXs2bMZPHgw/fr12+Xn3HzzzRx99NF07NiRK6+8kkKFCjFnzhwmTZrEkCFD0p/XqlUr7rjjDjZt2sRDDz20y9fs2bMn9erV45BDDmHjxo289tpr1KhRA4DSpUuTlJTExIkTqVChAgUKFCAlJYW77rqL6667jpSUFBo3bszGjRuZOXMmK1eu3G669MMPP0zVqlWpUaMGDz30ECtXruTyyy//D79rkqQcoWhRuPjicGzYAO++G4qMCRPCjs5PPx2OAgXg9NNDkdG0adgJWtLeWbcO3n47/Ft79VVYuXLbY4UKwRlnhOL+zDPDv1FJkpRrWSDuxF/Lwlgs88tDgEsvvZT169dz5JFHkpiYyPXXX0/79u13+Tm1a9dmypQp3HrrrRx//PHE43EOPPDAf0xRPu+88+jYsSOJiYnb7eC8I/ny5aNHjx4sXLiQpKQkjj/+eMaMGQOEdQsHDRrE3XffTc+ePTn++OOZPHkyV155JQULFuSBBx6ga9euFCpUiEMPPZTOnTtv99r33Xcf9913H5999hkHHXQQEyZMoGTJknv8eyVJysEKFAiFxZlnwtat8PHH29ZfW7gwlIoTJoQFjI8/PpSJ55wDlSpFnVzK+n77DV57LYwyfOstWL9+22MlS4YRhs2bw6mnhvV7JEmSyGW7MGdlJ510EnXq1GHAgAFRR8kUO9u9OSNk1z9zSdIeisfhiy+2rcv2+efbP3744WG0VPPmcMghbsIi/enHH8POyePHw/vvh2L+T5UqbdsE5ZhjwnRlSZKUK7gLsyRJynliMTjssHDccQcsWBDKxJdfhg8/hNmzw9GzJxx44LZS5Oij3RlWuUs8HjY++XM9w1mztn+8du1tO54fdphluyRJ+lcWiJIkKXuqUgVuuCEcy5eHNdxefhkmTYLvv4cHHwxHmTJhinOzZnDKKftmXRJpX0tLg+nTt5WG33677bFYDI47btvOyQccEFFISZKUXTmFWdmef+aSpO388UdY2238eHj9dVi9ettjRYpAkyZh9FWjRm4Moext/XqYMiUUhq+8AkuXbnssXz447bRQGJ59NpQuHVVKSZKURTmFWZIk5V5FisB554Vj0yaYPHnbVOdffoHnnw8HQPnyUL061KgRPv557Lef0zqVdfz6K3zzTTjmzt12vmBBmK78p+TksPlQ8+bQuHH4tyBJkpQBLBAlSVLOlS8fnH56OIYMgRkztu3oPH8+LFkSjvfe2/7zChfeVib+tVw86KDwmlJG27oVFi36Z0k4d27YOXlnypXbtnPyySf791OSJGUKC0RJkpQ7JCTAUUeF4777YNUqmDfvn2XN99/DmjUwc2Y4/ioxMWzQsqNy0enQ2h3r1oW/d3/+nfvz7938+bBx484/r1KlHf+9K13a0bKSJCnTWSBKkqTcqWjRbYXiX23aFErEv48E++absL7i/PnhmDBh+88rU+afU6Fr1IAKFdwFOreJx8PGPjuadrxo0c4/L39+qFbtnyVhtWpQqNC+yy9JkvQ3FoiSJEl/lS9fKG9q1AjTQv8Uj4fpzjsqFn/+GZYtC8fkydu/XsGCcPDB/yyFqlYFN//K3rZsCesQ7ujvxMqVO/+84sW3/V3469+JypXDKFdJkqQsxgJRkiRpd8RiYXOV/faDU0/d/rHU1G3TUv9aJH37bZiy+umn4firhASoUmXH01JLlNh3vy79uzVr/jnd/c8/302bdvw5sVgoBP/+Z1ujBpQsuU/jS5Ik/VcWiLlA5cqV6dy5M507d47k65900knUqVOHAQMGRPL1JUnKdMnJcMQR4firzZvhhx/+OZV17txQOn7/fThef337zytV6p9ToatXD+vgOR06c8TjYZfuv69N+M038NNPO/+8pKRtI0z/+udVtWp4TJIkKQewQNyFmUtm0m1SN/qe1pf65etHHedfjRgxgs6dO7Nq1art7p8xYwaFXDdHkqR9L2/eUC4dfDCcc862++PxMN357yPa5s6FxYthxYpwfPDB9q9XoEBYD+/vI9qqVbOs2l2bN29b4/LvI0ZTU3f+eaVL77jU3X9/S11JkpTjRVogPvzwwzzwwAMsXbqUww47jMGDB3PkkUdGGWk7oz4fxf8W/o+nP386WxSIO1OqVKn//BqbN28mb968GZBGkiQRi0HZsuE4+eTtH1uzJmzS8vdycf582LABvvgiHH9/vT936f37Ri6lSuXOXXpXr97xtOPvvgtrF+5IQgIccMA/S8KDD3ZauSRJytUiKxCff/55brzxRoYOHcpRRx3FgAEDaNSoEfPmzaN06dKZ8jXXblq708cSExIpkKcAi1Yt4td1v7JhywbGfDUGgOe+eo4LDrmAeDxOiYIlqFy0Mkl5t13l39HrFsq35yP+Jk6cSK9evfjqq69ITEykQYMGDBw4kAMPPJCFCxdSpUoVxo0bx+DBg5k+fTpVq1Zl6NChNGjQgMmTJ3PZZZcBEPv/HxLuuOMO7rzzzn9MYf7mm2+48sormTlzJgcccACDBg3itNNOY/z48TRr1iz9a40ZM4ZHHnmE6dOnM3ToUJo2bUrHjh15//33WblyJQceeCC33HILLVu23PZ7sXYt11xzDS+99BJFihThpptu2uPfB0mScrXCheHww8PxV1u2wMKF/xw1N3du2LBj4cJwTJy4/ecVLw4HHhg2h8kNtm4NOx3/8svOn1Ow4I7XnqxaNeyELEmSpO1EViD279+fdu3apZdeQ4cO5fXXX+epp56ie/fu2z1348aNbNy4Mf126q6ml+xC4T6Fd/pYk6pNeP3i16k8sPI/HluxbgXHDT8u/faJlU5kctvJ6bcrD6zMr+t+3e5z4nfE9zjf2rVrufHGG6lduzZr1qyhZ8+eNG/enM8++yz9ObfeeisPPvggVatW5dZbb6Vly5Z89913HHPMMQwYMICePXsyb9688Ost/M9f79atW2nWrBn7778/06dP548//qBLly47zNO9e3f69etH3bp1KVCgABs2bKBevXrcfPPNJCcn8/rrr3PJJZdw4IEHpo8c7dq1K1OmTOGVV16hdOnS3HLLLcyePZs6ders8e+HJEn6izx54KCDwnHWWdvuj8fDdOcdTclduBB+/z0cuVHZsjvexGS//Zx2LEmStAciKRA3bdrErFmz6NGjR/p9CQkJNGzYkKlTp/7j+X369OGuu+7aJ9meaf4MbV9py5a0nUxtyUQtWrTY7vZTTz1FqVKlmDNnTnoZeNNNN3HmmWcCcNddd3HIIYfw3XffUb16dVJSUojFYpQtW3anX2PSpEl8//33TJ48Of159957L6eddto/ntu5c2fOPffc7e7764jCTp068dZbbzF27FiOPPJI1qxZw7Bhw3jmmWc49f93pxw5ciQVKlTYi98NSZK0W2KxsD5f6dJwwgnbP7ZuXZj6vHAhpKVFEi8S5cuHsrBo0aiTSJIk5QiRFIi//vorW7dupUyZMtvdX6ZMGb755pt/PL9Hjx7ceOON6bdTU1OpWLHiHn/dNT3W7PSxxIREAFrVbkWNUjWo93i9fzznw8s+pE7ZOiTEtr9ivfD6hXucZUe+/fZbevbsyfTp0/n1119J+/9v9H/88Udq1qwJQO3atdOfX65cOQCWL19O9erVd+trzJs3j4oVK25XMu5s3cn69bdf93Hr1q307t2bsWPH8vPPP7Np0yY2btxIwYIFAfj+++/ZtGkTRx11VPrnFC9enIMPPni3skmSpAxWsCDUqRMOSZIkaS9li12Y8+fPT/4MWI9mT9clTCCBNNLSPyblTdrha+zNeoc70rRpUypVqsQTTzxB+fLlSUtLo1atWmzatCn9OX/dyOTPtQ7TMmlEwd93bn7ggQcYOHAgAwYM4NBDD6VQoUJ07tx5u3ySJEmSJEnKWSJZ/KVkyZIkJiaybNmy7e5ftmzZLqff7iulC5WmbOGy1Ctfj6FnDqVe+XqULVyW0oUyZ3MXgN9++4158+Zx2223ceqpp1KjRg1Wrly5R6+RL18+tm7dusvnHHzwwSxevHi73/sZM2bs1ut/9NFHnHPOObRu3ZrDDjuMAw74v/buPabK+47j+Occ5YAMAeUiMAWRWuzqpZa1BHqfrNSarmyNc85U19FaHXZajbGuXZkunQ6cJnVNb+mwSZd1uky7SzdDabWpWGYpppVSVwzKkItbO262DoHv/jCcFeEcepxwOPB+JSQ9z/P9PXxPzjffPn55zvNM09///nf3/pSUFAUFBamsrMy97d///nevGAAAAAAAAAQWv1yB6HK5lJaWppKSEuXk5Ei6cBVdSUmJVq1a5Y+UepkcPlknV5+Ua4xLDodDy9OWq6OrQ8FjB++pfBMmTFBUVJSee+45xcfHq7a2ts/DZAYydepUtbe3q6SkRHPmzFFoaKj768U9vv71ryslJUXLli1TQUGB2tra9Nhjj0n63xWNnkyfPl2/+93vVFpaqgkTJmj79u1qampyf706LCxMubm5Wr9+vaKiohQbG6tHH31UTm5SDgAAAAAAELD8NtlZu3atnn/+eb344ouqqqrSypUrdfbsWfdTmf0teGywe6DmcDgGdXgoXXiIzMsvv6zy8nLNnDlTDz/8sAoLC306RmZmplasWKFFixYpJiZGBQUFfWLGjBmjffv2qb29Xdddd53uv/9+Pfroo5KkkJAQr8d/7LHHdO211yo7O1u33nqr4uLi3APgHoWFhbrpppt01113KSsrSzfeeKPS0vreTxIAAAAAAACBwWFm5q9f/stf/lKFhYVqbGzUNddcoyeffLLXAzg8aW1tVUREhFpaWhQeHt5r37lz51RTU6Pk5OQBB2K44NChQ7rxxhtVXV2tlJQUf6fjMz5zAAAAAAAA33ibr13Mrw9RWbVq1bD4yvJos3fvXoWFhWn69Omqrq7W6tWrdcMNNwTk8BAAAAAAAACDKyCewozLq62tTRs2bFBtba2io6OVlZWlX/ziF/5OCwAAAAAAAMMQA8RRaOnSpVq6dKm/0wAAAAAAAEAA4PG4AAAAAAAAADwasQPE7u5uf6eAIcJnDQAAAAAAMHhG3FeYXS6XnE6n6uvrFRMTI5fLJYfD4e+0MAjMTB0dHfrnP/8pp9Mpl8vl75QAAAAAAABGnBE3QHQ6nUpOTlZDQ4Pq6+v9nQ6GQGhoqBITE+V0jtgLagEAAAAAAPxmxA0QpQtXISYmJqqzs1NdXV3+TgeDaMyYMRo7dixXmQIAAAAAAAySETlAlCSHw6GgoCAFBQX5OxUAAAAAAAAgYPGdTwAAAAAAAAAeMUAEAAAAAAAA4BEDRAAAAAAAAAAeBeQ9EM1MktTa2urnTAAAAAAAAIDA0zNX65mzeROQA8S2tjZJ0pQpU/ycCQAAAAAAABC42traFBER4TXGYV9kzDjMdHd3q76+XuPHj5fD4fB3Opdda2urpkyZon/84x8KDw/3dzoIANQMfEXNwFfUDHxFzcBX1Ax8Rc3AV9QMfDXSa8bM1NbWpoSEBDmd3u9yGJBXIDqdTk2ePNnfaQy68PDwEVmgGDzUDHxFzcBX1Ax8Rc3AV9QMfEXNwFfUDHw1kmtmoCsPe/AQFQAAAAAAAAAeMUAEAAAAAAAA4BEDxGEoODhY+fn5Cg4O9ncqCBDUDHxFzcBX1Ax8Rc3AV9QMfEXNwFfUDHxFzfxPQD5EBQAAAAAAAMDQ4ApEAAAAAAAAAB4xQAQAAAAAAADgEQNEAAAAAAAAAB4xQAQAAAAAAADgEQNEAAAAAAAAAB4xQPSTJ554QpmZmQoNDVVkZGS/MbW1tVqwYIFCQ0MVGxur9evXq7Oz0+txP/nkEy1ZskTh4eGKjIxUbm6u2tvbB+EdwJ8OHDggh8PR78+RI0c8rrv11lv7xK9YsWIIM4c/TZ06tc/nv3XrVq9rzp07p7y8PEVFRSksLEz33HOPmpqahihj+NPJkyeVm5ur5ORkjRs3TikpKcrPz1dHR4fXdfSZ0eWpp57S1KlTFRISovT0dP3tb3/zGr9nzx7NmDFDISEhmjVrll599dUhyhT+tmXLFl133XUaP368YmNjlZOTo+PHj3tds2vXrj79JCQkZIgyhr/95Cc/6fP5z5gxw+saeszo1t+5rsPhUF5eXr/x9JjR580339Rdd92lhIQEORwO7du3r9d+M9Pjjz+u+Ph4jRs3TllZWfroo48GPK6v50OBigGin3R0dGjhwoVauXJlv/u7urq0YMECdXR0qLS0VC+++KJ27dqlxx9/3OtxlyxZosrKShUXF+tPf/qT3nzzTS1fvnww3gL8KDMzUw0NDb1+7r//fiUnJ+urX/2q17UPPPBAr3UFBQVDlDWGg82bN/f6/B966CGv8Q8//LD++Mc/as+ePTp48KDq6+v1rW99a4iyhT99+OGH6u7u1rPPPqvKykrt2LFDzzzzjH70ox8NuJY+Mzr89re/1dq1a5Wfn693331Xc+bMUXZ2ts6cOdNvfGlpqRYvXqzc3FxVVFQoJydHOTk5Onbs2BBnDn84ePCg8vLy9Pbbb6u4uFjnz5/X7bffrrNnz3pdFx4e3qufnDp1aogyxnBw9dVX9/r833rrLY+x9BgcOXKkV70UFxdLkhYuXOhxDT1mdDl79qzmzJmjp556qt/9BQUFevLJJ/XMM8+orKxMX/rSl5Sdna1z5855PKav50MBzeBXRUVFFhER0Wf7q6++ak6n0xobG93bnn76aQsPD7f//Oc//R7rgw8+MEl25MgR97a//OUv5nA47PTp05c9dwwfHR0dFhMTY5s3b/Yad8stt9jq1auHJikMO0lJSbZjx44vHN/c3GxBQUG2Z88e97aqqiqTZIcPHx6EDDHcFRQUWHJystcY+szocf3111teXp77dVdXlyUkJNiWLVv6jf/2t79tCxYs6LUtPT3dHnzwwUHNE8PTmTNnTJIdPHjQY4yn82SMDvn5+TZnzpwvHE+PwcVWr15tKSkp1t3d3e9+eszoJsn27t3rft3d3W1xcXFWWFjo3tbc3GzBwcH2m9/8xuNxfD0fCmRcgThMHT58WLNmzdKkSZPc27Kzs9Xa2qrKykqPayIjI3tdgZaVlSWn06mysrJBzxn+84c//EEff/yx7rvvvgFjf/3rXys6OlozZ87Uxo0b9emnnw5Bhhgutm7dqqioKM2dO1eFhYVeb4tQXl6u8+fPKysry71txowZSkxM1OHDh4ciXQwzLS0tmjhx4oBx9JmRr6OjQ+Xl5b36g9PpVFZWlsf+cPjw4V7x0oVzG/rJ6NTS0iJJA/aU9vZ2JSUlacqUKbr77rs9ngdjZProo4+UkJCgadOmacmSJaqtrfUYS4/B53V0dOill17S97//fTkcDo9x9Bj0qKmpUWNjY68+EhERofT0dI995FLOhwLZWH8ngP41Njb2Gh5Kcr9ubGz0uCY2NrbXtrFjx2rixIke12BkeOGFF5Sdna3Jkyd7jfvud7+rpKQkJSQk6L333tOGDRt0/Phx/f73vx+iTOFPP/zhD3Xttddq4sSJKi0t1caNG9XQ0KDt27f3G9/Y2CiXy9XnPq2TJk2ip4xC1dXV2rlzp7Zt2+Y1jj4zOvzrX/9SV1dXv+cqH374Yb9rPJ3b0E9Gn+7ubq1Zs0Y33HCDZs6c6TEuNTVVv/rVrzR79my1tLRo27ZtyszMVGVl5YDnPAh86enp2rVrl1JTU9XQ0KBNmzbppptu0rFjxzR+/Pg+8fQYfN6+ffvU3Nys733vex5j6DH4vJ5e4UsfuZTzoUDGAPEyeuSRR/Tzn//ca0xVVdWAN//F6HUpNVRXV6f9+/dr9+7dAx7/8/fDnDVrluLj4zVv3jydOHFCKSkpl544/MaXmlm7dq172+zZs+VyufTggw9qy5YtCg4OHuxUMUxcSp85ffq07rjjDi1cuFAPPPCA17X0GQADycvL07Fjx7zez06SMjIylJGR4X6dmZmpq666Ss8++6x++tOfDnaa8LP58+e7/3v27NlKT09XUlKSdu/erdzcXD9mhkDwwgsvaP78+UpISPAYQ48BfMMA8TJat26d179wSNK0adO+0LHi4uL6PLmn58mncXFxHtdcfKPOzs5OffLJJx7XYHi5lBoqKipSVFSUvvGNb/j8+9LT0yVduLKIf9gHpv+n76Snp6uzs1MnT55Uampqn/1xcXHq6OhQc3Nzr6sQm5qa6CkBzNeaqa+v12233abMzEw999xzPv8++szIFB0drTFjxvR5Kru3/hAXF+dTPEamVatWuR/05+sVPkFBQZo7d66qq6sHKTsMZ5GRkbryyis9fv70GPQ4deqUXnvtNZ+//UCPGd16ekVTU5Pi4+Pd25uamnTNNdf0u+ZSzocCGQPEyygmJkYxMTGX5VgZGRl64okndObMGffXkouLixUeHq6vfOUrHtc0NzervLxcaWlpkqTXX39d3d3d7n/AYXjztYbMTEVFRVq6dKmCgoJ8/n1Hjx6VpF4NEoHl/+k7R48eldPp7HPrgx5paWkKCgpSSUmJ7rnnHknS8ePHVVtb2+uvtQgsvtTM6dOnddtttyktLU1FRUVyOn2/dTJ9ZmRyuVxKS0tTSUmJcnJyJF34WmpJSYlWrVrV75qMjAyVlJRozZo17m3FxcX0k1HCzPTQQw9p7969OnDggJKTk30+RldXl95//33deeedg5Ahhrv29nadOHFC9957b7/76THoUVRUpNjYWC1YsMCndfSY0S05OVlxcXEqKSlxDwxbW1tVVlamlStX9rvmUs6HApq/n+IyWp06dcoqKips06ZNFhYWZhUVFVZRUWFtbW1mZtbZ2WkzZ86022+/3Y4ePWp//etfLSYmxjZu3Og+RllZmaWmplpdXZ172x133GFz5861srIye+utt2z69Om2ePHiIX9/GBqvvfaaSbKqqqo+++rq6iw1NdXKysrMzKy6uto2b95s77zzjtXU1Ngrr7xi06ZNs5tvvnmo04YflJaW2o4dO+zo0aN24sQJe+mllywmJsaWLl3qjrm4ZszMVqxYYYmJifb666/bO++8YxkZGZaRkeGPt4AhVldXZ1dccYXNmzfP6urqrKGhwf3z+Rj6zOj18ssvW3BwsO3atcs++OADW758uUVGRlpjY6OZmd177732yCOPuOMPHTpkY8eOtW3btllVVZXl5+dbUFCQvf/++/56CxhCK1eutIiICDtw4ECvfvLpp5+6Yy6umU2bNtn+/fvtxIkTVl5ebt/5zncsJCTEKisr/fEWMMTWrVtnBw4csJqaGjt06JBlZWVZdHS0nTlzxszoMehfV1eXJSYm2oYNG/rso8egra3NPXuRZNu3b7eKigo7deqUmZlt3brVIiMj7ZVXXrH33nvP7r77bktOTrbPPvvMfYyvfe1rtnPnTvfrgc6HRhIGiH6ybNkyk9Tn54033nDHnDx50ubPn2/jxo2z6OhoW7dunZ0/f969/4033jBJVlNT49728ccf2+LFiy0sLMzCw8Ptvvvucw8lMfIsXrzYMjMz+91XU1PTq6Zqa2vt5ptvtokTJ1pwcLBdccUVtn79emtpaRnCjOEv5eXllp6ebhERERYSEmJXXXWV/exnP7Nz5865Yy6uGTOzzz77zH7wgx/YhAkTLDQ01L75zW/2GiBh5CoqKur3/1Of/9sjfQY7d+60xMREc7lcdv3119vbb7/t3nfLLbfYsmXLesXv3r3brrzySnO5XHb11Vfbn//85yHOGP7iqZ8UFRW5Yy6umTVr1rjra9KkSXbnnXfau+++O/TJwy8WLVpk8fHx5nK57Mtf/rItWrTIqqur3fvpMejP/v37TZIdP368zz56DHpmKBf/9NRFd3e3/fjHP7ZJkyZZcHCwzZs3r08tJSUlWX5+fq9t3s6HRhKHmdmQXOoIAAAAAAAAIOD4fjMjAAAAAAAAAKMGA0QAAAAAAAAAHjFABAAAAAAAAOARA0QAAAAAAAAAHjFABAAAAAAAAOARA0QAAAAAAAAAHjFABAAAAAAAAOARA0QAAAAAAAAAHjFABAAAAAAAAOARA0QAAAAAAAAAHjFABAAAAAAAAODRfwEF+6U/k+N+bQAAAABJRU5ErkJggg==", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "# размер шага (learning rate)\n", + "learning_rate = 0.1\n", + "\n", + "plt.figure(figsize=(16, 6))\n", + "plt.plot(X, Y, 'r', label='Y(X)')\n", + "plt.plot(start_point, func(start_point), '*g', label='start_point')\n", + "plt.plot([start_point, next_point_1], func(np.array([start_point, next_point_1])), '--*b', label='prev step')\n", + "\n", + "next_point_2 = curr_point - learning_rate * grad\n", + "plt.plot([curr_point, next_point_2], func(np.array([curr_point, next_point_2])), '--*g', label='antigrad')\n", + "plt.legend();" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "gS0Z1swagJ7M" + }, + "source": [ + "И получаем еще одну точку, которая уже ближе к минимуму функции.\n", + "\n", + "Оформим небольшой цикл для градиентного спуска." + ] + }, + { + "cell_type": "code", + "execution_count": 30, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 926 + }, + "id": "qZc1XOjuqyvz", + "outputId": "2c50fd60-910a-4cb6-c1ff-3d697a5cb265" + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Итерация: 0\n", + "Текущая точка 5| Следующая точка 4.0\n", + "--------------------------------------------------------\n", + "Итерация: 1\n", + "Текущая точка 4.0| Следующая точка 3.2\n", + "--------------------------------------------------------\n", + "Итерация: 2\n", + "Текущая точка 3.2| Следующая точка 2.56\n", + "--------------------------------------------------------\n", + "Итерация: 3\n", + "Текущая точка 2.56| Следующая точка 2.048\n", + "--------------------------------------------------------\n", + "Итерация: 4\n", + "Текущая точка 2.048| Следующая точка 1.6384\n", + "--------------------------------------------------------\n", + "Итерация: 5\n", + "Текущая точка 1.6384| Следующая точка 1.31072\n", + "--------------------------------------------------------\n", + "Итерация: 6\n", + "Текущая точка 1.31072| Следующая точка 1.0485760000000002\n", + "--------------------------------------------------------\n", + "Итерация: 7\n", + "Текущая точка 1.0485760000000002| Следующая точка 0.8388608000000002\n", + "--------------------------------------------------------\n", + "Итерация: 8\n", + "Текущая точка 0.8388608000000002| Следующая точка 0.6710886400000001\n", + "--------------------------------------------------------\n", + "Итерация: 9\n", + "Текущая точка 0.6710886400000001| Следующая точка 0.5368709120000001\n", + "--------------------------------------------------------\n", + "минимум 0.5368709120000001, количество затраченных итераций: 9\n" + ] + }, + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "# первоначальное точка\n", + "start_point = 5\n", + "\n", + "# размер шага (learning rate)\n", + "learning_rate = 0.1\n", + "\n", + "# начальная точка\n", + "next_point = start_point\n", + "\n", + "x = []\n", + "x.append(next_point)\n", + "\n", + "plt.figure(figsize=(16, 6))\n", + "plt.plot(X, Y, 'r', label='Y(X)')\n", + "\n", + "# количество итерация \n", + "n = 10\n", + "for i in range(n):\n", + " current_point = next_point\n", + "\n", + " # движение в негативную сторону вычисляемого градиента\n", + " next_point = current_point - learning_rate * gr_func(current_point)\n", + " x.append(next_point)\n", + " # print(next_point) \n", + "\n", + " # остановка когда достигнута необходимая степень точности\n", + " print(f\"Итерация: {i}\")\n", + " print(f\"Текущая точка {current_point}| Следующая точка {next_point}\")\n", + " print(\"--------------------------------------------------------\")\n", + " \n", + " \n", + "\n", + "print(f\"минимум {next_point}, количество затраченных итераций: {i}\") \n", + "X_grad = np.array(x)\n", + "plt.plot(X_grad, func(X_grad), '-*g', label = 'GD')\n", + "plt.legend()\n", + "plt.xlabel('X')\n", + "plt.ylabel('Y')\n", + "plt.show()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "f7Nfx3xqqtLp" + }, + "source": [ + "Прошли 10 шагов и практически находимся в минимуме функции." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "R_FZFLAjrN6v" + }, + "source": [ + "А если мы сделаем больше итераций, то наверняка алгоритм сойдется к 0.\n" + ] + }, + { + "cell_type": "code", + "execution_count": 31, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 1000 + }, + "id": "9mIcLlcSrKiG", + "outputId": "61132eea-bdc0-45e1-a9cb-a1f941c7a128" + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Итерация: 0\n", + "Текущая точка 5| Следующая точка 4.0\n", + "--------------------------------------------------------\n", + "Итерация: 1\n", + "Текущая точка 4.0| Следующая точка 3.2\n", + "--------------------------------------------------------\n", + "Итерация: 2\n", + "Текущая точка 3.2| Следующая точка 2.56\n", + "--------------------------------------------------------\n", + "Итерация: 3\n", + "Текущая точка 2.56| Следующая точка 2.048\n", + "--------------------------------------------------------\n", + "Итерация: 4\n", + "Текущая точка 2.048| Следующая точка 1.6384\n", + "--------------------------------------------------------\n", + "Итерация: 5\n", + "Текущая точка 1.6384| Следующая точка 1.31072\n", + "--------------------------------------------------------\n", + "Итерация: 6\n", + "Текущая точка 1.31072| Следующая точка 1.0485760000000002\n", + "--------------------------------------------------------\n", + "Итерация: 7\n", + "Текущая точка 1.0485760000000002| Следующая точка 0.8388608000000002\n", + "--------------------------------------------------------\n", + "Итерация: 8\n", + "Текущая точка 0.8388608000000002| Следующая точка 0.6710886400000001\n", + "--------------------------------------------------------\n", + "Итерация: 9\n", + "Текущая точка 0.6710886400000001| Следующая точка 0.5368709120000001\n", + "--------------------------------------------------------\n", + "Итерация: 10\n", + "Текущая точка 0.5368709120000001| Следующая точка 0.4294967296000001\n", + "--------------------------------------------------------\n", + "Итерация: 11\n", + "Текущая точка 0.4294967296000001| Следующая точка 0.3435973836800001\n", + "--------------------------------------------------------\n", + "Итерация: 12\n", + "Текущая точка 0.3435973836800001| Следующая точка 0.27487790694400005\n", + "--------------------------------------------------------\n", + "Итерация: 13\n", + "Текущая точка 0.27487790694400005| Следующая точка 0.21990232555520003\n", + "--------------------------------------------------------\n", + "Итерация: 14\n", + "Текущая точка 0.21990232555520003| Следующая точка 0.17592186044416003\n", + "--------------------------------------------------------\n", + "Итерация: 15\n", + "Текущая точка 0.17592186044416003| Следующая точка 0.140737488355328\n", + "--------------------------------------------------------\n", + "Итерация: 16\n", + "Текущая точка 0.140737488355328| Следующая точка 0.11258999068426241\n", + "--------------------------------------------------------\n", + "Итерация: 17\n", + "Текущая точка 0.11258999068426241| Следующая точка 0.09007199254740993\n", + "--------------------------------------------------------\n", + "Итерация: 18\n", + "Текущая точка 0.09007199254740993| Следующая точка 0.07205759403792794\n", + "--------------------------------------------------------\n", + "Итерация: 19\n", + "Текущая точка 0.07205759403792794| Следующая точка 0.057646075230342354\n", + "--------------------------------------------------------\n", + "Итерация: 20\n", + "Текущая точка 0.057646075230342354| Следующая точка 0.04611686018427388\n", + "--------------------------------------------------------\n", + "Итерация: 21\n", + "Текущая точка 0.04611686018427388| Следующая точка 0.03689348814741911\n", + "--------------------------------------------------------\n", + "Итерация: 22\n", + "Текущая точка 0.03689348814741911| Следующая точка 0.029514790517935284\n", + "--------------------------------------------------------\n", + "Итерация: 23\n", + "Текущая точка 0.029514790517935284| Следующая точка 0.02361183241434823\n", + "--------------------------------------------------------\n", + "Итерация: 24\n", + "Текущая точка 0.02361183241434823| Следующая точка 0.018889465931478583\n", + "--------------------------------------------------------\n", + "Итерация: 25\n", + "Текущая точка 0.018889465931478583| Следующая точка 0.015111572745182867\n", + "--------------------------------------------------------\n", + "Итерация: 26\n", + "Текущая точка 0.015111572745182867| Следующая точка 0.012089258196146294\n", + "--------------------------------------------------------\n", + "Итерация: 27\n", + "Текущая точка 0.012089258196146294| Следующая точка 0.009671406556917036\n", + "--------------------------------------------------------\n", + "Итерация: 28\n", + "Текущая точка 0.009671406556917036| Следующая точка 0.007737125245533628\n", + "--------------------------------------------------------\n", + "Итерация: 29\n", + "Текущая точка 0.007737125245533628| Следующая точка 0.006189700196426903\n", + "--------------------------------------------------------\n", + "Итерация: 30\n", + "Текущая точка 0.006189700196426903| Следующая точка 0.004951760157141522\n", + "--------------------------------------------------------\n", + "Итерация: 31\n", + "Текущая точка 0.004951760157141522| Следующая точка 0.003961408125713218\n", + "--------------------------------------------------------\n", + "Итерация: 32\n", + "Текущая точка 0.003961408125713218| Следующая точка 0.0031691265005705745\n", + "--------------------------------------------------------\n", + "Итерация: 33\n", + "Текущая точка 0.0031691265005705745| Следующая точка 0.00253530120045646\n", + "--------------------------------------------------------\n", + "Итерация: 34\n", + "Текущая точка 0.00253530120045646| Следующая точка 0.0020282409603651678\n", + "--------------------------------------------------------\n", + "Итерация: 35\n", + "Текущая точка 0.0020282409603651678| Следующая точка 0.0016225927682921343\n", + "--------------------------------------------------------\n", + "Итерация: 36\n", + "Текущая точка 0.0016225927682921343| Следующая точка 0.0012980742146337075\n", + "--------------------------------------------------------\n", + "Итерация: 37\n", + "Текущая точка 0.0012980742146337075| Следующая точка 0.001038459371706966\n", + "--------------------------------------------------------\n", + "Итерация: 38\n", + "Текущая точка 0.001038459371706966| Следующая точка 0.0008307674973655728\n", + "--------------------------------------------------------\n", + "Итерация: 39\n", + "Текущая точка 0.0008307674973655728| Следующая точка 0.0006646139978924582\n", + "--------------------------------------------------------\n", + "Итерация: 40\n", + "Текущая точка 0.0006646139978924582| Следующая точка 0.0005316911983139665\n", + "--------------------------------------------------------\n", + "Итерация: 41\n", + "Текущая точка 0.0005316911983139665| Следующая точка 0.00042535295865117324\n", + "--------------------------------------------------------\n", + "Итерация: 42\n", + "Текущая точка 0.00042535295865117324| Следующая точка 0.0003402823669209386\n", + "--------------------------------------------------------\n", + "Итерация: 43\n", + "Текущая точка 0.0003402823669209386| Следующая точка 0.00027222589353675085\n", + "--------------------------------------------------------\n", + "Итерация: 44\n", + "Текущая точка 0.00027222589353675085| Следующая точка 0.0002177807148294007\n", + "--------------------------------------------------------\n", + "Итерация: 45\n", + "Текущая точка 0.0002177807148294007| Следующая точка 0.00017422457186352054\n", + "--------------------------------------------------------\n", + "Итерация: 46\n", + "Текущая точка 0.00017422457186352054| Следующая точка 0.00013937965749081642\n", + "--------------------------------------------------------\n", + "Итерация: 47\n", + "Текущая точка 0.00013937965749081642| Следующая точка 0.00011150372599265314\n", + "--------------------------------------------------------\n", + "Итерация: 48\n", + "Текущая точка 0.00011150372599265314| Следующая точка 8.920298079412252e-05\n", + "--------------------------------------------------------\n", + "Итерация: 49\n", + "Текущая точка 8.920298079412252e-05| Следующая точка 7.136238463529802e-05\n", + "--------------------------------------------------------\n", + "Итерация: 50\n", + "Текущая точка 7.136238463529802e-05| Следующая точка 5.7089907708238416e-05\n", + "--------------------------------------------------------\n", + "Итерация: 51\n", + "Текущая точка 5.7089907708238416e-05| Следующая точка 4.567192616659073e-05\n", + "--------------------------------------------------------\n", + "Итерация: 52\n", + "Текущая точка 4.567192616659073e-05| Следующая точка 3.653754093327259e-05\n", + "--------------------------------------------------------\n", + "Итерация: 53\n", + "Текущая точка 3.653754093327259e-05| Следующая точка 2.923003274661807e-05\n", + "--------------------------------------------------------\n", + "Итерация: 54\n", + "Текущая точка 2.923003274661807e-05| Следующая точка 2.3384026197294454e-05\n", + "--------------------------------------------------------\n", + "Итерация: 55\n", + "Текущая точка 2.3384026197294454e-05| Следующая точка 1.8707220957835564e-05\n", + "--------------------------------------------------------\n", + "Итерация: 56\n", + "Текущая точка 1.8707220957835564e-05| Следующая точка 1.4965776766268452e-05\n", + "--------------------------------------------------------\n", + "Итерация: 57\n", + "Текущая точка 1.4965776766268452e-05| Следующая точка 1.1972621413014761e-05\n", + "--------------------------------------------------------\n", + "Итерация: 58\n", + "Текущая точка 1.1972621413014761e-05| Следующая точка 9.578097130411809e-06\n", + "--------------------------------------------------------\n", + "Итерация: 59\n", + "Текущая точка 9.578097130411809e-06| Следующая точка 7.662477704329448e-06\n", + "--------------------------------------------------------\n", + "Итерация: 60\n", + "Текущая точка 7.662477704329448e-06| Следующая точка 6.129982163463559e-06\n", + "--------------------------------------------------------\n", + "Итерация: 61\n", + "Текущая точка 6.129982163463559e-06| Следующая точка 4.903985730770847e-06\n", + "--------------------------------------------------------\n", + "Итерация: 62\n", + "Текущая точка 4.903985730770847e-06| Следующая точка 3.923188584616677e-06\n", + "--------------------------------------------------------\n", + "Итерация: 63\n", + "Текущая точка 3.923188584616677e-06| Следующая точка 3.138550867693342e-06\n", + "--------------------------------------------------------\n", + "Итерация: 64\n", + "Текущая точка 3.138550867693342e-06| Следующая точка 2.5108406941546735e-06\n", + "--------------------------------------------------------\n", + "Итерация: 65\n", + "Текущая точка 2.5108406941546735e-06| Следующая точка 2.008672555323739e-06\n", + "--------------------------------------------------------\n", + "Итерация: 66\n", + "Текущая точка 2.008672555323739e-06| Следующая точка 1.606938044258991e-06\n", + "--------------------------------------------------------\n", + "Итерация: 67\n", + "Текущая точка 1.606938044258991e-06| Следующая точка 1.2855504354071928e-06\n", + "--------------------------------------------------------\n", + "Итерация: 68\n", + "Текущая точка 1.2855504354071928e-06| Следующая точка 1.0284403483257543e-06\n", + "--------------------------------------------------------\n", + "Итерация: 69\n", + "Текущая точка 1.0284403483257543e-06| Следующая точка 8.227522786606034e-07\n", + "--------------------------------------------------------\n", + "Итерация: 70\n", + "Текущая точка 8.227522786606034e-07| Следующая точка 6.582018229284827e-07\n", + "--------------------------------------------------------\n", + "Итерация: 71\n", + "Текущая точка 6.582018229284827e-07| Следующая точка 5.265614583427862e-07\n", + "--------------------------------------------------------\n", + "Итерация: 72\n", + "Текущая точка 5.265614583427862e-07| Следующая точка 4.2124916667422894e-07\n", + "--------------------------------------------------------\n", + "Итерация: 73\n", + "Текущая точка 4.2124916667422894e-07| Следующая точка 3.3699933333938316e-07\n", + "--------------------------------------------------------\n", + "Итерация: 74\n", + "Текущая точка 3.3699933333938316e-07| Следующая точка 2.6959946667150655e-07\n", + "--------------------------------------------------------\n", + "Итерация: 75\n", + "Текущая точка 2.6959946667150655e-07| Следующая точка 2.1567957333720524e-07\n", + "--------------------------------------------------------\n", + "Итерация: 76\n", + "Текущая точка 2.1567957333720524e-07| Следующая точка 1.725436586697642e-07\n", + "--------------------------------------------------------\n", + "Итерация: 77\n", + "Текущая точка 1.725436586697642e-07| Следующая точка 1.3803492693581135e-07\n", + "--------------------------------------------------------\n", + "Итерация: 78\n", + "Текущая точка 1.3803492693581135e-07| Следующая точка 1.1042794154864907e-07\n", + "--------------------------------------------------------\n", + "Итерация: 79\n", + "Текущая точка 1.1042794154864907e-07| Следующая точка 8.834235323891926e-08\n", + "--------------------------------------------------------\n", + "Итерация: 80\n", + "Текущая точка 8.834235323891926e-08| Следующая точка 7.067388259113541e-08\n", + "--------------------------------------------------------\n", + "Итерация: 81\n", + "Текущая точка 7.067388259113541e-08| Следующая точка 5.653910607290833e-08\n", + "--------------------------------------------------------\n", + "Итерация: 82\n", + "Текущая точка 5.653910607290833e-08| Следующая точка 4.5231284858326664e-08\n", + "--------------------------------------------------------\n", + "Итерация: 83\n", + "Текущая точка 4.5231284858326664e-08| Следующая точка 3.618502788666133e-08\n", + "--------------------------------------------------------\n", + "Итерация: 84\n", + "Текущая точка 3.618502788666133e-08| Следующая точка 2.8948022309329066e-08\n", + "--------------------------------------------------------\n", + "Итерация: 85\n", + "Текущая точка 2.8948022309329066e-08| Следующая точка 2.3158417847463252e-08\n", + "--------------------------------------------------------\n", + "Итерация: 86\n", + "Текущая точка 2.3158417847463252e-08| Следующая точка 1.8526734277970603e-08\n", + "--------------------------------------------------------\n", + "Итерация: 87\n", + "Текущая точка 1.8526734277970603e-08| Следующая точка 1.4821387422376482e-08\n", + "--------------------------------------------------------\n", + "Итерация: 88\n", + "Текущая точка 1.4821387422376482e-08| Следующая точка 1.1857109937901186e-08\n", + "--------------------------------------------------------\n", + "Итерация: 89\n", + "Текущая точка 1.1857109937901186e-08| Следующая точка 9.485687950320948e-09\n", + "--------------------------------------------------------\n", + "Итерация: 90\n", + "Текущая точка 9.485687950320948e-09| Следующая точка 7.588550360256759e-09\n", + "--------------------------------------------------------\n", + "Итерация: 91\n", + "Текущая точка 7.588550360256759e-09| Следующая точка 6.070840288205408e-09\n", + "--------------------------------------------------------\n", + "Итерация: 92\n", + "Текущая точка 6.070840288205408e-09| Следующая точка 4.856672230564326e-09\n", + "--------------------------------------------------------\n", + "Итерация: 93\n", + "Текущая точка 4.856672230564326e-09| Следующая точка 3.885337784451461e-09\n", + "--------------------------------------------------------\n", + "Итерация: 94\n", + "Текущая точка 3.885337784451461e-09| Следующая точка 3.108270227561169e-09\n", + "--------------------------------------------------------\n", + "Итерация: 95\n", + "Текущая точка 3.108270227561169e-09| Следующая точка 2.4866161820489353e-09\n", + "--------------------------------------------------------\n", + "Итерация: 96\n", + "Текущая точка 2.4866161820489353e-09| Следующая точка 1.989292945639148e-09\n", + "--------------------------------------------------------\n", + "Итерация: 97\n", + "Текущая точка 1.989292945639148e-09| Следующая точка 1.5914343565113183e-09\n", + "--------------------------------------------------------\n", + "Итерация: 98\n", + "Текущая точка 1.5914343565113183e-09| Следующая точка 1.2731474852090548e-09\n", + "--------------------------------------------------------\n", + "Итерация: 99\n", + "Текущая точка 1.2731474852090548e-09| Следующая точка 1.0185179881672439e-09\n", + "--------------------------------------------------------\n", + "минимум 1.0185179881672439e-09, количество затраченных итераций: 99\n" + ] + }, + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "# первоначальное точка\n", + "start_point = 5\n", + "\n", + "# размер шага (learning rate)\n", + "learning_rate = 0.1\n", + "\n", + "# начальная точка\n", + "next_point = start_point\n", + "\n", + "x = []\n", + "x.append(next_point)\n", + "\n", + "plt.figure(figsize=(16, 6))\n", + "plt.plot(X, Y, 'r', label='Y(X)')\n", + "\n", + "# количество итерация \n", + "n = 100\n", + "for i in range(n):\n", + " current_point = next_point\n", + "\n", + " # движение в негативную сторону вычисляемого градиента\n", + " next_point = current_point - learning_rate * gr_func(current_point)\n", + " x.append(next_point) \n", + "\n", + " # остановка когда достигнута необходимая степень точности\n", + " print(f\"Итерация: {i}\")\n", + " print(f\"Текущая точка {current_point}| Следующая точка {next_point}\")\n", + " print(\"--------------------------------------------------------\")\n", + " \n", + " \n", + "\n", + "print(f\"минимум {next_point}, количество затраченных итераций: {i}\") \n", + "X_grad = np.array(x)\n", + "plt.plot(X_grad, func(X_grad), '-*g', label = 'GD')\n", + "plt.legend()\n", + "plt.xlabel('X')\n", + "plt.ylabel('Y')\n", + "plt.show()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "BWV6HvSRrTO0" + }, + "source": [ + "Но здесь значения самой лучшей минимальной точки на последних шагах очень похожи и на самом деле мы могли не ждать столько итераций и выйти из цикла раньше.\n", + "\n", + "Для этого введем значение eps, с помощью которого будем проверять разницу между текущей точкой и следующей точкой и если она меньше eps (а значит точки очень близки), то можем выйти из алгоритма." + ] + }, + { + "cell_type": "code", + "execution_count": 32, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 1000 + }, + "id": "nrM5GLhBxpS9", + "outputId": "f3c037e1-83fe-480c-aa05-272bf7e647dd" + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Итерация: 0\n", + "Текущая точка 5| Следующая точка 4.0\n", + "--------------------------------------------------------\n", + "Итерация: 1\n", + "Текущая точка 4.0| Следующая точка 3.2\n", + "--------------------------------------------------------\n", + "Итерация: 2\n", + "Текущая точка 3.2| Следующая точка 2.56\n", + "--------------------------------------------------------\n", + "Итерация: 3\n", + "Текущая точка 2.56| Следующая точка 2.048\n", + "--------------------------------------------------------\n", + "Итерация: 4\n", + "Текущая точка 2.048| Следующая точка 1.6384\n", + "--------------------------------------------------------\n", + "Итерация: 5\n", + "Текущая точка 1.6384| Следующая точка 1.31072\n", + "--------------------------------------------------------\n", + "Итерация: 6\n", + "Текущая точка 1.31072| Следующая точка 1.0485760000000002\n", + "--------------------------------------------------------\n", + "Итерация: 7\n", + "Текущая точка 1.0485760000000002| Следующая точка 0.8388608000000002\n", + "--------------------------------------------------------\n", + "Итерация: 8\n", + "Текущая точка 0.8388608000000002| Следующая точка 0.6710886400000001\n", + "--------------------------------------------------------\n", + "Итерация: 9\n", + "Текущая точка 0.6710886400000001| Следующая точка 0.5368709120000001\n", + "--------------------------------------------------------\n", + "Итерация: 10\n", + "Текущая точка 0.5368709120000001| Следующая точка 0.4294967296000001\n", + "--------------------------------------------------------\n", + "Итерация: 11\n", + "Текущая точка 0.4294967296000001| Следующая точка 0.3435973836800001\n", + "--------------------------------------------------------\n", + "Итерация: 12\n", + "Текущая точка 0.3435973836800001| Следующая точка 0.27487790694400005\n", + "--------------------------------------------------------\n", + "Итерация: 13\n", + "Текущая точка 0.27487790694400005| Следующая точка 0.21990232555520003\n", + "--------------------------------------------------------\n", + "Итерация: 14\n", + "Текущая точка 0.21990232555520003| Следующая точка 0.17592186044416003\n", + "--------------------------------------------------------\n", + "Итерация: 15\n", + "Текущая точка 0.17592186044416003| Следующая точка 0.140737488355328\n", + "--------------------------------------------------------\n", + "Итерация: 16\n", + "Текущая точка 0.140737488355328| Следующая точка 0.11258999068426241\n", + "--------------------------------------------------------\n", + "Итерация: 17\n", + "Текущая точка 0.11258999068426241| Следующая точка 0.09007199254740993\n", + "--------------------------------------------------------\n", + "Итерация: 18\n", + "Текущая точка 0.09007199254740993| Следующая точка 0.07205759403792794\n", + "--------------------------------------------------------\n", + "Итерация: 19\n", + "Текущая точка 0.07205759403792794| Следующая точка 0.057646075230342354\n", + "--------------------------------------------------------\n", + "Итерация: 20\n", + "Текущая точка 0.057646075230342354| Следующая точка 0.04611686018427388\n", + "--------------------------------------------------------\n", + "Итерация: 21\n", + "Текущая точка 0.04611686018427388| Следующая точка 0.03689348814741911\n", + "--------------------------------------------------------\n", + "Итерация: 22\n", + "Текущая точка 0.03689348814741911| Следующая точка 0.029514790517935284\n", + "--------------------------------------------------------\n", + "Итерация: 23\n", + "Текущая точка 0.029514790517935284| Следующая точка 0.02361183241434823\n", + "--------------------------------------------------------\n", + "Итерация: 24\n", + "Текущая точка 0.02361183241434823| Следующая точка 0.018889465931478583\n", + "--------------------------------------------------------\n", + "Итерация: 25\n", + "Текущая точка 0.018889465931478583| Следующая точка 0.015111572745182867\n", + "--------------------------------------------------------\n", + "Итерация: 26\n", + "Текущая точка 0.015111572745182867| Следующая точка 0.012089258196146294\n", + "--------------------------------------------------------\n", + "Итерация: 27\n", + "Текущая точка 0.012089258196146294| Следующая точка 0.009671406556917036\n", + "--------------------------------------------------------\n", + "Итерация: 28\n", + "Текущая точка 0.009671406556917036| Следующая точка 0.007737125245533628\n", + "--------------------------------------------------------\n", + "Итерация: 29\n", + "Текущая точка 0.007737125245533628| Следующая точка 0.006189700196426903\n", + "--------------------------------------------------------\n", + "Итерация: 30\n", + "Текущая точка 0.006189700196426903| Следующая точка 0.004951760157141522\n", + "--------------------------------------------------------\n", + "Итерация: 31\n", + "Текущая точка 0.004951760157141522| Следующая точка 0.003961408125713218\n", + "--------------------------------------------------------\n", + "Итерация: 32\n", + "Текущая точка 0.003961408125713218| Следующая точка 0.0031691265005705745\n", + "--------------------------------------------------------\n", + "Итерация: 33\n", + "Текущая точка 0.0031691265005705745| Следующая точка 0.00253530120045646\n", + "--------------------------------------------------------\n", + "Итерация: 34\n", + "Текущая точка 0.00253530120045646| Следующая точка 0.0020282409603651678\n", + "--------------------------------------------------------\n", + "Итерация: 35\n", + "Текущая точка 0.0020282409603651678| Следующая точка 0.0016225927682921343\n", + "--------------------------------------------------------\n", + "Итерация: 36\n", + "Текущая точка 0.0016225927682921343| Следующая точка 0.0012980742146337075\n", + "--------------------------------------------------------\n", + "Итерация: 37\n", + "Текущая точка 0.0012980742146337075| Следующая точка 0.001038459371706966\n", + "--------------------------------------------------------\n", + "Итерация: 38\n", + "Текущая точка 0.001038459371706966| Следующая точка 0.0008307674973655728\n", + "--------------------------------------------------------\n", + "Итерация: 39\n", + "Текущая точка 0.0008307674973655728| Следующая точка 0.0006646139978924582\n", + "--------------------------------------------------------\n", + "Итерация: 40\n", + "Текущая точка 0.0006646139978924582| Следующая точка 0.0005316911983139665\n", + "--------------------------------------------------------\n", + "Итерация: 41\n", + "Текущая точка 0.0005316911983139665| Следующая точка 0.00042535295865117324\n", + "--------------------------------------------------------\n", + "Итерация: 42\n", + "Текущая точка 0.00042535295865117324| Следующая точка 0.0003402823669209386\n", + "--------------------------------------------------------\n", + "минимум 0.0003402823669209386, количество затраченных итераций: 42\n" + ] + }, + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "# установка минимального значения, на которое должны изменяться веса\n", + "eps = 0.0001\n", + "\n", + "# первоначальное точка\n", + "start_point = 5\n", + "\n", + "# размер шага (learning rate)\n", + "learning_rate = 0.1\n", + "\n", + "# начальная точка\n", + "next_point = start_point\n", + "\n", + "x = []\n", + "x.append(next_point)\n", + "\n", + "plt.figure(figsize=(16, 6))\n", + "plt.plot(X, Y, 'r', label='Y(X)')\n", + "\n", + "# количество итерация \n", + "n = 100\n", + "for i in range(n):\n", + " current_point = next_point\n", + "\n", + " # движение в негативную сторону вычисляемого градиента\n", + " next_point = current_point - learning_rate * gr_func(current_point)\n", + " x.append(next_point)\n", + "\n", + " # остановка когда достигнута необходимая степень точности\n", + " print(f\"Итерация: {i}\")\n", + " print(f\"Текущая точка {current_point}| Следующая точка {next_point}\")\n", + " print(\"--------------------------------------------------------\")\n", + " \n", + " if(abs(current_point - next_point) <= eps):\n", + " break\n", + "\n", + "print(f\"минимум {next_point}, количество затраченных итераций: {i}\") \n", + "X_grad = np.array(x)\n", + "plt.plot(X_grad, func(X_grad), '-*g', label = 'GD')\n", + "plt.legend()\n", + "plt.xlabel('X')\n", + "plt.ylabel('Y')\n", + "plt.show()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "BJWalgdYr2sU" + }, + "source": [ + "И да, алгоритму понадобилось всего лишь 42 итерации, разница между двумя точками оказалась меньше `eps`, а значит можем выйти из цикла схождения алгоритма - это называется критерий останова." + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "iSHnElKexpS8" + }, + "source": [ + "##### Алгоритм градиентного спуска\n", + "\n", + "1. Инициализация начальной точки\n", + "2. Цикл по k = 1,2,3,...:\n", + "\n", + "- $ w_{k} = w_{k-1} - \\eta\\nabla f(w_{k-1}) $\n", + "\n", + "- Если $||w_{k} - w_{k-1}|| < \\epsilon$, то завершить.\n" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "AGx1IbTptNvK" + }, + "source": [ + "#### Своя реализация линейной регрессии\n" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "8w_t8Y7Ns9WV" + }, + "source": [ + "Теперь зная, как работает метод оптимизации градиентный спуск, можем вернуться к задаче обучения линейной регрессии, но уже не с помощью `sklearn`, а вручную." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "dhbHnbLHu14I" + }, + "source": [ + "Берем те же самые данные, но вдобавок еще возвращем коэффициент наклона (коэффициент сдвига по умолчанию в такой генерации равен 0)." + ] + }, + { + "cell_type": "code", + "execution_count": 33, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 1000 + }, + "id": "8ZD69Hs6tSAX", + "outputId": "980d2644-0aa8-4a7c-f93c-58a69a000105", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "array([[ 0.63007982],\n", + " [-1.06163445],\n", + " [ 0.29634711],\n", + " [ 1.40277112],\n", + " [ 0.68968231],\n", + " [-0.53662936],\n", + " [-1.11947526],\n", + " [ 1.06755846],\n", + " [ 0.1178195 ],\n", + " [ 1.54907163],\n", + " [ 1.29561858],\n", + " [-0.03107509],\n", + " [ 0.56119218],\n", + " [ 0.42105072],\n", + " [-0.4864951 ],\n", + " [ 0.08897764],\n", + " [-0.18577532],\n", + " [-0.17809318],\n", + " [-0.23725045],\n", + " [-0.88623967],\n", + " [-0.47573349],\n", + " [ 0.21734821],\n", + " [-2.65331856],\n", + " [ 0.72575222],\n", + " [-0.38053642],\n", + " [-0.48456513],\n", + " [ 1.57463407],\n", + " [-1.30554851],\n", + " [-0.17241977],\n", + " [ 0.73683739],\n", + " [-1.23234621],\n", + " [ 0.31540267],\n", + " [ 1.74945474],\n", + " [ 0.09183837],\n", + " [-0.30957664],\n", + " [-1.18575527],\n", + " [-0.68344663],\n", + " [-0.31963136],\n", + " [-0.00828463],\n", + " [-0.64257539],\n", + " [ 1.0956297 ],\n", + " [ 0.06367166],\n", + " [-0.57395456],\n", + " [ 0.07349324],\n", + " [ 0.73227135],\n", + " [-1.06560298],\n", + " [-1.68411089],\n", + " [-1.54686257],\n", + " [-0.20437532],\n", + " [-0.286073 ]])" + ] + }, + "metadata": {}, + "output_type": "display_data" + }, + { + "data": { + "text/plain": [ + "array([ 43.6543408 , -72.68235021, 21.19644643, 107.58765071,\n", + " 69.62063217, -32.57566222, -101.61213107, 87.44514699,\n", + " 17.69898683, 131.00190463, 97.97802247, 2.70819092,\n", + " 52.42715419, 27.74476129, -31.82947365, 1.58209228,\n", + " -9.72570848, 4.57391214, -33.24586607, -74.34292886,\n", + " -22.6419015 , 15.84607909, -202.79645668, 49.05026172,\n", + " -34.9916168 , -33.95608308, 121.78273292, -123.72382672,\n", + " -1.90918067, 64.06753923, -91.73785524, 9.55252237,\n", + " 148.12427806, 22.21183346, -16.35144507, -113.95075954,\n", + " -47.70966758, -22.69082132, -1.79022499, -58.17761844,\n", + " 91.76970817, -12.7798199 , -38.1435921 , 17.48650737,\n", + " 40.52468632, -107.65815151, -134.20798669, -127.22516755,\n", + " -34.31360406, -10.90920383])" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "X, y, coeffs = make_regression(n_samples=50, n_features=1, n_informative=1,\n", + " noise=10, coef=True, random_state=11)\n", + "\n", + "display(X, y)" + ] + }, + { + "cell_type": "code", + "execution_count": 34, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "dZy0pvfbu7dF", + "outputId": "edebe80a-da61-42ab-a5ac-65ce9e92d99e" + }, + "outputs": [ + { + "data": { + "text/plain": [ + "array(80.65667909)" + ] + }, + "execution_count": 34, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "coeffs" + ] + }, + { + "cell_type": "code", + "execution_count": 35, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 388 + }, + "id": "jp5KReZ1tyRz", + "outputId": "afba6c24-e150-4293-b12c-46c755135ed7" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "import matplotlib.pyplot as plt\n", + "\n", + "\n", + "fig = plt.figure(figsize=(10, 6))\n", + "plt.scatter(X, y)\n", + "\n", + "plt.xlabel('feature')\n", + "plt.ylabel('target')\n", + "plt.show()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "1uqNje3QuFjX" + }, + "source": [ + "Функция, которую здесь оптимизируем - это MSE, её график для конкретно нашей задачи рисовали выше." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "qPe_CIdRvPcI" + }, + "source": [ + "Реализуем две функции:\n", + "1. mserror - функция среднеквадратичной ошибки $MSE = \\frac{1}{n}\\sum_{i=0}^n{(\\text{y}_i-\\text{y_pred}_i})^2 = \\frac{1}{n}\\sum_{i=0}^n{(\\text{y}_i-(w_1\\cdot X_i + w_0)})^2 = \\frac{1}{n}\\sum_{i=0}^n{(\\text{y}_i-w_1\\cdot X_i - w_0})^2$\n", + "\n", + "\n", + "2. gr_mserror - градиент функции MSE. Распишем его отдельно для коэффициента сдвига и коэффициента наклона:\n", + "\n", + "Сдвиг:\n", + "$\\frac{∂ MSE}{∂ w_0} = \\frac{1 \\cdot 2}{n}\\sum({y_i -\\text{y_pred}_i})\\cdot -1$\n", + "\n", + "Наклон:\n", + "$\\frac{∂ MSE}{∂ w_1} = \\frac{1 \\cdot 2}{n}\\sum({y_i -\\text{y_pred}_i})\\cdot -X$" + ] + }, + { + "cell_type": "code", + "execution_count": 36, + "metadata": { + "id": "fXl31ElsvPcI" + }, + "outputs": [], + "source": [ + "# функция, определяющая среднеквадратичную ошибку\n", + "def mserror(X, w1, w0, y):\n", + " y_pred = w1 * X[:, 0] + w0\n", + " return np.sum((y - y_pred) ** 2) / len(y_pred)\n", + "\n", + "# функция градиента\n", + "def gr_mserror(X, w1, w0, y):\n", + " y_pred = w1 * X[:, 0] + w0\n", + " return np.array([2/len(X)*np.sum((y - y_pred)) * (-1),\n", + " 2/len(X)*np.sum((y - y_pred) * (-X[:, 0]))])" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "c375lB7cubo1" + }, + "source": [ + "И остается запустить цикл градиентного спуска.\n", + "\n", + "В начале инициализировали коэффициенты, затем на каждом шаге считаем градиент, умножаем его на шаг обучения и вычитаем его из предыдущих значений коэффициентов и так далее пока не поймем, что точки коэффициентов очень похожи друг на друга на соседних итерациях." + ] + }, + { + "cell_type": "code", + "execution_count": 37, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "qyOwUsWZyCrz", + "outputId": "7521fd22-ab6a-40f6-a36e-ee928a84a52f" + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Итерация: 0\n", + "Текущая точка (0, 0)| Следующая точка (13.245106098282543, -1.3921748530551812)\n", + "MSE 5436.432058517568\n", + "--------------------------------------------------------\n", + "Итерация: 1\n", + "Текущая точка (13.245106098282543, -1.3921748530551812)| Следующая точка (24.283455474773014, -2.270634896573517)\n", + "MSE 3812.4417335187304\n", + "--------------------------------------------------------\n", + "Итерация: 2\n", + "Текущая точка (24.283455474773014, -2.270634896573517)| Следующая точка (33.487719285860635, -2.777322881591963)\n", + "MSE 2689.1325642433894\n", + "--------------------------------------------------------\n", + "Итерация: 3\n", + "Текущая точка (33.487719285860635, -2.777322881591963)| Следующая точка (41.166652649401456, -3.0191730536904307)\n", + "MSE 1910.2491839412482\n", + "--------------------------------------------------------\n", + "Итерация: 4\n", + "Текущая точка (41.166652649401456, -3.0191730536904307)| Следующая точка (47.57624618267611, -3.0762482285482444)\n", + "MSE 1368.9634120527255\n", + "--------------------------------------------------------\n", + "Итерация: 5\n", + "Текущая точка (47.57624618267611, -3.0762482285482444)| Следующая точка (52.92889586922186, -3.008051361710758)\n", + "MSE 992.010595522475\n", + "--------------------------------------------------------\n", + "Итерация: 6\n", + "Текущая точка (52.92889586922186, -3.008051361710758)| Следующая точка (57.40095014665679, -2.8584119151984995)\n", + "MSE 728.9953237861758\n", + "--------------------------------------------------------\n", + "Итерация: 7\n", + "Текущая точка (57.40095014665679, -2.8584119151984995)| Следующая точка (61.138926872179695, -2.659260887873855)\n", + "MSE 545.1558383956526\n", + "--------------------------------------------------------\n", + "Итерация: 8\n", + "Текущая точка (61.138926872179695, -2.659260887873855)| Следующая точка (64.2646390341644, -2.433540404481531)\n", + "MSE 416.45122384278307\n", + "--------------------------------------------------------\n", + "Итерация: 9\n", + "Текущая точка (64.2646390341644, -2.433540404481531)| Следующая точка (66.87942435861689, -2.19744033614948)\n", + "MSE 326.2142980059075\n", + "--------------------------------------------------------\n", + "Итерация: 10\n", + "Текущая точка (66.87942435861689, -2.19744033614948)| Следующая точка (69.06763839104693, -1.9621124640486494)\n", + "MSE 262.86371600250254\n", + "--------------------------------------------------------\n", + "Итерация: 11\n", + "Текущая точка (69.06763839104693, -1.9621124640486494)| Следующая точка (70.8995416710495, -1.7349797608563151)\n", + "MSE 218.33518111153128\n", + "--------------------------------------------------------\n", + "Итерация: 12\n", + "Текущая точка (70.8995416710495, -1.7349797608563151)| Следующая точка (72.4336880101809, -1.520732529514591)\n", + "MSE 187.00253533348857\n", + "--------------------------------------------------------\n", + "Итерация: 13\n", + "Текущая точка (72.4336880101809, -1.520732529514591)| Следующая точка (73.71890162494748, -1.322082889991646)\n", + "MSE 164.93367151659535\n", + "--------------------------------------------------------\n", + "Итерация: 14\n", + "Текущая точка (73.71890162494748, -1.322082889991646)| Следующая точка (74.79591515037744, -1.1403332478296038)\n", + "MSE 149.37600820692927\n", + "--------------------------------------------------------\n", + "Итерация: 15\n", + "Текущая точка (74.79591515037744, -1.1403332478296038)| Следующая точка (75.69872770576566, -0.9758019720797207)\n", + "MSE 138.39982870713823\n", + "--------------------------------------------------------\n", + "Итерация: 16\n", + "Текущая точка (75.69872770576566, -0.9758019720797207)| Следующая точка (76.45573166825358, -0.8281398136089831)\n", + "MSE 130.65048482717629\n", + "--------------------------------------------------------\n", + "Итерация: 17\n", + "Текущая точка (76.45573166825358, -0.8281398136089831)| Следующая точка (77.09064819864122, -0.6965630242691534)\n", + "MSE 125.17587305548757\n", + "--------------------------------------------------------\n", + "Итерация: 18\n", + "Текущая точка (77.09064819864122, -0.6965630242691534)| Следующая точка (77.62330450567968, -0.5800232339912165)\n", + "MSE 121.30608466627997\n", + "--------------------------------------------------------\n", + "Итерация: 19\n", + "Текущая точка (77.62330450567968, -0.5800232339912165)| Следующая точка (78.07028004458385, -0.47732954550339834)\n", + "MSE 118.5693021415083\n", + "--------------------------------------------------------\n", + "Итерация: 20\n", + "Текущая точка (78.07028004458385, -0.47732954550339834)| Следующая точка (78.44544409060278, -0.3872347313389438)\n", + "MSE 116.63292990920401\n", + "--------------------------------------------------------\n", + "Итерация: 21\n", + "Текущая точка (78.44544409060278, -0.3872347313389438)| Следующая точка (78.76040322042036, -0.3084946422381159)\n", + "MSE 115.26232714854191\n", + "--------------------------------------------------------\n", + "Итерация: 22\n", + "Текущая точка (78.76040322042036, -0.3084946422381159)| Следующая точка (79.024874019221, -0.23990778502053262)\n", + "MSE 114.29184073360233\n", + "--------------------------------------------------------\n", + "Итерация: 23\n", + "Текущая точка (79.024874019221, -0.23990778502053262)| Следующая точка (79.24699368416267, -0.18034036428991163)\n", + "MSE 113.60444739461153\n", + "--------------------------------------------------------\n", + "Итерация: 24\n", + "Текущая точка (79.24699368416267, -0.18034036428991163)| Следующая точка (79.43357901354796, -0.12874079838376576)\n", + "MSE 113.11743065929035\n", + "--------------------------------------------------------\n", + "Итерация: 25\n", + "Текущая точка (79.43357901354796, -0.12874079838376576)| Следующая точка (79.590342471717, -0.08414673157126629)\n", + "MSE 112.77229367773498\n", + "--------------------------------------------------------\n", + "Итерация: 26\n", + "Текущая точка (79.590342471717, -0.08414673157126629)| Следующая точка (79.72207253439184, -0.045686805736328245)\n", + "MSE 112.5276488913149\n", + "--------------------------------------------------------\n", + "Итерация: 27\n", + "Текущая точка (79.72207253439184, -0.045686805736328245)| Следующая точка (79.83278429207604, -0.012578874154160535)\n", + "MSE 112.35420203791824\n", + "--------------------------------------------------------\n", + "Итерация: 28\n", + "Текущая точка (79.83278429207604, -0.012578874154160535)| Следующая точка (79.92584527446147, 0.01587410273549933)\n", + "MSE 112.23121107508297\n", + "--------------------------------------------------------\n", + "Итерация: 29\n", + "Текущая точка (79.92584527446147, 0.01587410273549933)| Следующая точка (80.00408061916187, 0.0402895757954151)\n", + "MSE 112.14398472877181\n", + "--------------------------------------------------------\n", + "Итерация: 30\n", + "Текущая точка (80.00408061916187, 0.0402895757954151)| Следующая точка (80.06986101275434, 0.061211690132424876)\n", + "MSE 112.08211443091523\n", + "--------------------------------------------------------\n", + "Итерация: 31\n", + "Текущая точка (80.06986101275434, 0.061211690132424876)| Следующая точка (80.12517625583499, 0.07911787359402343)\n", + "MSE 112.03822398727151\n", + "--------------------------------------------------------\n", + "Итерация: 32\n", + "Текущая точка (80.12517625583499, 0.07911787359402343)| Следующая точка (80.1716968258466, 0.09442541434069902)\n", + "MSE 112.0070849682984\n", + "--------------------------------------------------------\n", + "Итерация: 33\n", + "Текущая точка (80.1716968258466, 0.09442541434069902)| Следующая точка (80.21082541475698, 0.10749781647693545)\n", + "MSE 111.98499059416774\n", + "--------------------------------------------------------\n", + "Итерация: 34\n", + "Текущая точка (80.21082541475698, 0.10749781647693545)| Следующая точка (80.24374008920961, 0.11865080004710715)\n", + "MSE 111.96931241806891\n", + "--------------------------------------------------------\n", + "Итерация: 35\n", + "Текущая точка (80.24374008920961, 0.11865080004710715)| Следующая точка (80.2714304469608, 0.1281578677088226)\n", + "MSE 111.95818633748331\n", + "--------------------------------------------------------\n", + "Итерация: 36\n", + "Текущая точка (80.2714304469608, 0.1281578677088226)| Следующая точка (80.29472791571294, 0.13625540033755565)\n", + "MSE 111.95029014106852\n", + "--------------------------------------------------------\n", + "Итерация: 37\n", + "Текущая точка (80.29472791571294, 0.13625540033755565)| Следующая точка (80.3143311509696, 0.14314727172458203)\n", + "MSE 111.94468586607258\n", + "--------------------------------------------------------\n", + "Итерация: 38\n", + "Текущая точка (80.3143311509696, 0.14314727172458203)| Следующая точка (80.33082733176776, 0.14900899149088742)\n", + "MSE 111.9407080587951\n", + "--------------------------------------------------------\n", + "Итерация: 39\n", + "Текущая точка (80.33082733176776, 0.14900899149088742)| Следующая точка (80.34471002169886, 0.15399139770567302)\n", + "MSE 111.93788455593705\n", + "--------------------------------------------------------\n", + "Итерация: 40\n", + "Текущая точка (80.34471002169886, 0.15399139770567302)| Следующая точка (80.35639415306127, 0.15822392825594017)\n", + "MSE 111.93588031188328\n", + "--------------------------------------------------------\n", + "Итерация: 41\n", + "Текущая точка (80.35639415306127, 0.15822392825594017)| Следующая точка (80.3662286006031, 0.16181750411360082)\n", + "MSE 111.93445756119772\n", + "--------------------------------------------------------\n", + "Итерация: 42\n", + "Текущая точка (80.3662286006031, 0.16181750411360082)| Следующая точка (80.37450673505678, 0.16486705930322332)\n", + "MSE 111.93344756203358\n", + "--------------------------------------------------------\n", + "Итерация: 43\n", + "Текущая точка (80.37450673505678, 0.16486705930322332)| Следующая точка (80.3814752830035, 0.16745375234425586)\n", + "MSE 111.93273055134894\n", + "--------------------------------------------------------\n", + "Итерация: 44\n", + "Текущая точка (80.3814752830035, 0.16745375234425586)| Следующая точка (80.38734176642754, 0.16964689278727177)\n", + "MSE 111.93222152388138\n", + "--------------------------------------------------------\n", + "Итерация: 45\n", + "Текущая точка (80.38734176642754, 0.16964689278727177)| Следующая точка (80.39228075088505, 0.1715056145957146)\n", + "MSE 111.93186014187545\n", + "--------------------------------------------------------\n", + "Итерация: 46\n", + "Текущая точка (80.39228075088505, 0.1715056145957146)| Следующая точка (80.39643909406131, 0.17308032584082383)\n", + "MSE 111.93160357509205\n", + "--------------------------------------------------------\n", + "Итерация: 47\n", + "Текущая точка (80.39643909406131, 0.17308032584082383)| Следующая точка (80.39994035542131, 0.17441396169048307)\n", + "MSE 111.9314214197364\n", + "--------------------------------------------------------\n", + "Итерация: 48\n", + "Текущая точка (80.39994035542131, 0.17441396169048307)| Следующая точка (80.40288850166267, 0.17554306513125753)\n", + "MSE 111.93129209244117\n", + "--------------------------------------------------------\n", + "Итерация: 49\n", + "Текущая точка (80.40288850166267, 0.17554306513125753)| Следующая точка (80.40537102092192, 0.17649871736794565)\n", + "MSE 111.93120027093673\n", + "--------------------------------------------------------\n", + "Итерация: 50\n", + "Текущая точка (80.40537102092192, 0.17649871736794565)| Следующая точка (80.40746154046687, 0.1773073374625193)\n", + "MSE 111.93113507749824\n", + "--------------------------------------------------------\n", + "Итерация: 51\n", + "Текущая точка (80.40746154046687, 0.1773073374625193)| Следующая точка (80.40922202734937, 0.17799136854473532)\n", + "MSE 111.93108878953852\n", + "--------------------------------------------------------\n", + "Итерация: 52\n", + "Текущая точка (80.40922202734937, 0.17799136854473532)| Следующая точка (80.41070463870736, 0.17856986587197987)\n", + "MSE 111.9310559243356\n", + "--------------------------------------------------------\n", + "Итерация: 53\n", + "Текущая точка (80.41070463870736, 0.17856986587197987)| Следующая точка (80.41195327769022, 0.1790590001450439)\n", + "MSE 111.93103258931154\n", + "--------------------------------------------------------\n", + "Итерация: 54\n", + "Текущая точка (80.41195327769022, 0.1790590001450439)| Следующая точка (80.41300490199842, 0.1794724877994691)\n", + "MSE 111.93101602080289\n", + "--------------------------------------------------------\n", + "Итерация: 55\n", + "Текущая точка (80.41300490199842, 0.1794724877994691)| Следующая точка (80.41389062449502, 0.1798219584829086)\n", + "MSE 111.93100425662863\n", + "--------------------------------------------------------\n", + "Итерация: 56\n", + "Текущая точка (80.41389062449502, 0.1798219584829086)| Следующая точка (80.41463663902786, 0.18011726858776034)\n", + "MSE 111.93099590363774\n", + "--------------------------------------------------------\n", + "Итерация: 57\n", + "Текущая точка (80.41463663902786, 0.18011726858776034)| Следующая точка (80.41526499929918, 0.18036676852314196)\n", + "MSE 111.93098997268032\n", + "--------------------------------------------------------\n", + "Итерация: 58\n", + "Текущая точка (80.41526499929918, 0.18036676852314196)| Следующая точка (80.41579427417048, 0.18057753036794924)\n", + "MSE 111.93098576144426\n", + "--------------------------------------------------------\n", + "Итерация: 59\n", + "Текущая точка (80.41579427417048, 0.18057753036794924)| Следующая точка (80.4162400990548, 0.18075554163382535)\n", + "MSE 111.93098277127257\n", + "--------------------------------------------------------\n", + "Итерация: 60\n", + "Текущая точка (80.4162400990548, 0.18075554163382535)| Следующая точка (80.41661563991356, 0.18090587007021305)\n", + "MSE 111.9309806481053\n", + "--------------------------------------------------------\n", + "Итерация: 61\n", + "Текущая точка (80.41661563991356, 0.18090587007021305)| Следующая точка (80.41693198374094, 0.18103280375061692)\n", + "MSE 111.93097914054856\n", + "--------------------------------------------------------\n", + "Итерация: 62\n", + "Текущая точка (80.41693198374094, 0.18103280375061692)| Следующая точка (80.4171984672076, 0.18113997007799426)\n", + "MSE 111.93097807010358\n", + "--------------------------------------------------------\n", + "Итерация: 63\n", + "Текущая точка (80.4171984672076, 0.18113997007799426)| Следующая точка (80.41742295327681, 0.18123043682693823)\n", + "MSE 111.93097731002919\n", + "--------------------------------------------------------\n", + "Итерация: 64\n", + "Текущая точка (80.41742295327681, 0.18123043682693823)| Следующая точка (80.41761206404517, 0.1813067978911081)\n", + "MSE 111.93097677033369\n", + "--------------------------------------------------------\n", + "Итерация: 65\n", + "Текущая точка (80.41761206404517, 0.1813067978911081)| Следующая точка (80.41777137674777, 0.18137124601724236)\n", + "MSE 111.93097638711887\n", + "--------------------------------------------------------\n", + "Итерация: 66\n", + "Текущая точка (80.41777137674777, 0.18137124601724236)| Следующая точка (80.41790558876512, 0.1814256344741146)\n", + "MSE 111.93097611501378\n", + "--------------------------------------------------------\n", + "Итерация: 67\n", + "Текущая точка (80.41790558876512, 0.1814256344741146)| Следующая точка (80.41801865654197, 0.18147152931880287)\n", + "MSE 111.9309759218029\n", + "--------------------------------------------------------\n", + "Итерация: 68\n", + "Текущая точка (80.41801865654197, 0.18147152931880287)| Следующая точка (80.41811391254866, 0.18151025367739462)\n", + "MSE 111.93097578461146\n", + "--------------------------------------------------------\n" + ] + } + ], + "source": [ + "# установка минимального значения, на которое должны изменяться веса\n", + "eps = 0.0001\n", + "\n", + "# первоначальное точка\n", + "w1 = 0\n", + "w0 = 0\n", + "\n", + "# размер шага (learning rate)\n", + "learning_rate = 0.1\n", + "\n", + "next_w1 = w1\n", + "next_w0 = w0\n", + "# количество итерация \n", + "n = 100\n", + "for i in range(n):\n", + " cur_w1 = next_w1\n", + " cur_w0 = next_w0\n", + "\n", + " # движение в негативную сторону вычисляемого градиента\n", + " next_w0 = cur_w0 - learning_rate * gr_mserror(X, cur_w1, cur_w0, y)[0]\n", + " next_w1 = cur_w1 - learning_rate * gr_mserror(X, cur_w1, cur_w0, y)[1]\n", + "\n", + " # остановка когда достигнута необходимая степень точности\n", + " print(f\"Итерация: {i}\")\n", + " print(f\"Текущая точка {cur_w1, cur_w0}| Следующая точка {next_w1, next_w0}\")\n", + " print(f\"MSE {mserror(X, cur_w1, cur_w0, y)}\")\n", + " print(\"--------------------------------------------------------\")\n", + " \n", + " if (abs(cur_w1 - next_w1) <= eps) and (abs(cur_w0 - next_w0) <= eps):\n", + " break" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "yNm--2XU9mNg" + }, + "source": [ + "А мы получили точно такую же метрику, которая получалась у `LinearRegression` из `sklearn`.\n", + "\n", + "Сравним полученные коэффициенты с теми, которые были сгенерированы вместе с данными." + ] + }, + { + "cell_type": "code", + "execution_count": 38, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "yh6UMSWP9z5C", + "outputId": "d1b132a5-b54d-492e-ff59-84a165996c2f" + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Коэффициенты наклона True 80.65667909277211, trained 80.41811391254866\n", + "Коэффициенты сдвига True 0, trained 0.18151025367739462\n" + ] + } + ], + "source": [ + "print('Коэффициенты наклона', end=' ')\n", + "print(f'True {coeffs}, trained {next_w1}')\n", + "\n", + "print('Коэффициенты сдвига', end=' ')\n", + "print(f'True 0, trained {next_w0}')" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "ALbIVv6J9-tX" + }, + "source": [ + "А они очень похожи.\n", + "\n", + "А визуализированные кривые наслаиваются друг на друга" + ] + }, + { + "cell_type": "code", + "execution_count": 39, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 388 + }, + "id": "Vux7A3Da-WW6", + "outputId": "cfa10d85-94f5-40d3-997a-dd7a8619c437" + }, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "fig = plt.figure(figsize=(10, 6))\n", + "\n", + "x = np.arange(-3, 3)\n", + "our_model_y = next_w1 * x + next_w0\n", + "\n", + "plt.plot(x, model_y_sk, linewidth=4, alpha=0.5, c='r', label=f'sklearn linear_model = {model_a:.2f}x + {model_b:.2f}')\n", + "plt.plot(x, our_model_y, '--g', linewidth=2, label=f'our linear_model = {next_w1:.2f}x + {next_w0:.2f}')\n", + "plt.scatter(X, y) \n", + "plt.grid()\n", + "plt.xlabel('feature')\n", + "plt.ylabel('target')\n", + "plt.legend(prop={'size': 16})\n", + "plt.show()" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "rEmVJTfv_EZ-" + }, + "source": [ + "### Многомерная линейная регрессия\n", + "\n", + "Сейчас мы посмотрели на то, как обучается линейная регрессия для задач с одним признаком.\n", + "\n", + "Построим себе данные поинтересней, состоящие из 4 признаков, это уже отрисовать не сможем.\n", + "\n" + ] + }, + { + "cell_type": "code", + "execution_count": 40, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 1000 + }, + "id": "96dLeOqm_kKq", + "outputId": "0b18b8ec-205e-4af6-af82-b5dd9fcb7d92", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "array([[ 0.85866717, -1.26407368, 1.11487028, 0.43477699],\n", + " [ 1.29127473, -0.96420485, 0.07175977, 0.2716063 ],\n", + " [ 1.06755846, -1.06163445, 0.21734821, 0.1178195 ],\n", + " [ 0.07101978, 0.92157523, -0.37682984, 0.91998254],\n", + " [ 0.27540666, 0.18632534, -1.13980565, 0.14180489],\n", + " [ 0.29634711, 1.40277112, -1.54686257, 1.29561858],\n", + " [-1.68728061, -1.69734212, -0.41145394, -0.04527514],\n", + " [ 0.5936862 , 0.37050633, 1.34537807, 1.01594215],\n", + " [-0.86335252, -0.13054147, -0.52308763, -0.25127692],\n", + " [ 0.65402488, 1.79948007, 1.5466061 , 1.60987398],\n", + " [ 1.0956297 , -0.30957664, 0.72575222, 1.54907163],\n", + " [-0.39117313, 1.53422235, -0.16419295, 0.36036665],\n", + " [ 0.68731235, -1.82300958, 0.8791138 , 1.84636487],\n", + " [-1.0616544 , -0.68448467, -0.47621448, 0.83031043],\n", + " [-1.1288944 , 0.01699688, -0.42442882, -0.1329099 ],\n", + " [ 0.51002802, 0.33871394, -1.17212003, -1.04596765],\n", + " [ 1.08771086, 0.53382172, 0.39521201, 0.12286753],\n", + " [-1.55107946, 0.94303598, 0.34115344, 0.13827322],\n", + " [-1.57749431, 1.31094364, -0.79286501, -0.07174941],\n", + " [-1.53214252, 0.21886858, 0.18566325, 1.83277654],\n", + " [ 1.20910164, -0.8430661 , -0.14189358, 0.38535414],\n", + " [ 1.65920462, 0.37864068, -0.46456606, 0.15384125],\n", + " [-1.44071935, 1.47651282, -0.13155348, 0.1944292 ],\n", + " [-0.00828463, -0.31963136, -0.53662936, 0.31540267],\n", + " [-0.37842255, -0.48897544, -0.64439382, 0.69914084],\n", + " [-0.23725045, -1.23234621, -0.17241977, 0.09183837],\n", + " [-0.18577532, -0.38053642, 0.08897764, 0.06367166],\n", + " [ 1.4924715 , -1.11523722, -0.70541403, -0.04723257],\n", + " [ 0.51655239, -0.08940364, 0.68212971, 0.15072201],\n", + " [ 1.74945474, -0.286073 , -0.48456513, -2.65331856],\n", + " [ 2.15667443, -0.82943725, -0.52937203, 1.56170369],\n", + " [-1.08019383, -0.43205762, 0.51608404, 0.45539286],\n", + " [-0.17809318, -0.57395456, -0.20437532, -0.4864951 ],\n", + " [-0.53085824, -0.86986194, -1.15526422, 0.79667185],\n", + " [ 0.76616062, -0.99402769, -0.26434233, 1.54220922],\n", + " [ 0.85615205, -0.04480262, -0.47748923, -0.15406552],\n", + " [ 0.68968231, 0.56119218, -1.30554851, -1.11947526],\n", + " [ 0.87427277, 0.0716521 , -1.63905163, -0.64730263],\n", + " [-1.29742262, -0.71496244, 0.51447963, 0.25771638],\n", + " [-1.68411089, -1.18575527, 0.60010201, 0.69556726],\n", + " [ 0.63007982, 0.07349324, 0.73227135, -0.64257539],\n", + " [-0.10514925, -1.58396258, -1.37177369, -0.02831834],\n", + " [-2.04905726, 0.86705521, -0.26196107, 0.57897111],\n", + " [ 0.42105072, -1.06560298, -0.88623967, -0.47573349],\n", + " [-0.49673048, 0.50502192, 0.93878313, -0.67502027],\n", + " [-0.06766856, -0.41320975, 0.1200828 , -0.69897169],\n", + " [ 0.73683739, 1.57463407, -0.03107509, -0.68344663],\n", + " [ 0.59527845, -0.68280162, -0.71355993, -1.90828954],\n", + " [ 0.81776957, 0.03679475, -0.04870254, 1.7915311 ],\n", + " [ 2.20185631, -0.0370669 , 1.93290543, -1.99357153]])" + ] + }, + "metadata": {}, + "output_type": "display_data" + }, + { + "data": { + "text/plain": [ + "array([ 43.59907368, 33.3226129 , 12.92842886, 56.76209111,\n", + " -28.24075472, 64.36182392, -220.93063391, 134.81614163,\n", + " -111.85450024, 244.9327123 , 106.23869476, 83.15972598,\n", + " 22.1607008 , -87.67552386, -94.67026039, -29.62752165,\n", + " 119.90179833, -16.36526242, -71.2734975 , -33.77825083,\n", + " 24.31113443, 102.14682115, 1.12585934, -48.81175726,\n", + " -58.59186113, -111.47215424, -12.5784088 , -14.21337533,\n", + " 64.61172215, 10.81251385, 99.11401244, -75.98950916,\n", + " -52.77978396, -112.95415032, 7.45744433, 33.69756994,\n", + " -24.66640928, -35.64805852, -76.68888106, -129.08694753,\n", + " 59.65011241, -158.52958483, -61.09970272, -97.83194751,\n", + " 36.42924987, -49.96145024, 104.10943674, -80.90767725,\n", + " 99.76081282, 152.70106779])" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "from sklearn.datasets import make_regression\n", + "\n", + "X, y = make_regression(n_samples=50, n_features=4, n_informative=4,\n", + " noise=10, random_state=11)\n", + "\n", + "display(X, y)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "L389l2QmCBeI" + }, + "source": [ + "#### Из sklearn" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "SQDLd3sv_ubX" + }, + "source": [ + "Обучим для начала модель из `sklearn`" + ] + }, + { + "cell_type": "code", + "execution_count": 41, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "3ArQO5TI_qOq", + "outputId": "4602856f-72a2-41bd-b945-efed584e99a1", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "
LinearRegression()
In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.
" + ], + "text/plain": [ + "LinearRegression()" + ] + }, + "execution_count": 41, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "model = LinearRegression()\n", + "model.fit(X, y)" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "L0SIDCaB_qOs" + }, + "source": [ + "Посмотрим обученные коэффициенты и теперь давайте их называть весами.\n", + "\n", + "Есть веса при признаках - это и есть коэффициенты наклона но по каждой оси.\n", + "\n", + "И есть один свободный вес - коэффициент сдвига." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "l0TPVblH_-2H" + }, + "source": [ + "Получаем 4 веса при признаках - значения для каждого признака, которые сообщают, насколько нужно наклонить прямую относительно каждой оси.\n", + "\n", + "И один сдвиг - свободный вес." + ] + }, + { + "cell_type": "code", + "execution_count": 42, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "qsgZhUMk_qOs", + "outputId": "aeeb1dbd-d8e5-45b8-804b-3920395e6a1f", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "(array([59.51225616, 57.72556421, 44.70715115, 24.87193091]),\n", + " -1.6392969526147305)" + ] + }, + "execution_count": 42, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "model.coef_, model.intercept_" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "Kl5cJtLhcmn5" + }, + "source": [ + "Можем сделать предсказания этой моделью, сначала через метод `predict`." + ] + }, + { + "cell_type": "code", + "execution_count": 43, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "zUGT6x6ucsLj", + "outputId": "f20ad239-b090-477a-9534-75752a910003", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "array([37.14897504])" + ] + }, + "execution_count": 43, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "model.predict(X[:1])" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "QcgBXyOAcx1-" + }, + "source": [ + "А теперь с помощью перемножения весов на признаки, суммирования их и добавления свободного веса." + ] + }, + { + "cell_type": "code", + "execution_count": 44, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "h99wvhpTc4Qk", + "outputId": "58291f95-4cd6-49da-b6dd-6e13b984fab2", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "37.148975042692896" + ] + }, + "execution_count": 44, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.sum(model.coef_ * X[0]) + model.intercept_" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "Lq2hstvtBDTo" + }, + "source": [ + "Давайте посчитаем ошибку на предсказаниях модели, при этом получим предсказания не одним способом (через `model.predict`), а еще и вторым, сами перемножим веса (`model.coef_`) на значения признаков (`X`) и добавим значение сдвига (`model.intercept_`)\n", + "\n", + "Выходит, что неважно, как мы получаем предсказания они всё равно одинаковые." + ] + }, + { + "cell_type": "code", + "execution_count": 45, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 206 + }, + "id": "lEyoJKCWAUvz", + "outputId": "b0e0419a-b0bc-45b6-b62d-48d1c0b6b685", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
0123ypred_fitpred_dot
00.858667-1.2640741.1148700.43477743.59907437.14897537.148975
11.291275-0.9642050.0717600.27160633.32261329.51165429.511654
21.067558-1.0616340.2173480.11782012.92842913.25748613.257486
30.0710200.921575-0.3768300.91998356.76209161.82045461.820454
40.2754070.186325-1.1398060.141805-28.240755-21.923992-21.923992
\n", + "
" + ], + "text/plain": [ + " 0 1 2 3 y pred_fit pred_dot\n", + "0 0.858667 -1.264074 1.114870 0.434777 43.599074 37.148975 37.148975\n", + "1 1.291275 -0.964205 0.071760 0.271606 33.322613 29.511654 29.511654\n", + "2 1.067558 -1.061634 0.217348 0.117820 12.928429 13.257486 13.257486\n", + "3 0.071020 0.921575 -0.376830 0.919983 56.762091 61.820454 61.820454\n", + "4 0.275407 0.186325 -1.139806 0.141805 -28.240755 -21.923992 -21.923992" + ] + }, + "execution_count": 45, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df = pd.DataFrame(X)\n", + "df['y'] = y\n", + "df['pred_fit'] = model.predict(X)\n", + "df['pred_dot'] = X.dot(model.coef_) + model.intercept_\n", + "\n", + "df.head()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "vmltua2HAR7I" + }, + "source": [ + "Посчитаем отклонения предсказаний от истины." + ] + }, + { + "cell_type": "code", + "execution_count": 46, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 206 + }, + "id": "yXq4rvEuAR7I", + "outputId": "d966ee93-19ca-4920-a5ec-0d7d0dcdb240", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
0123ypred_fitpred_dotresidual
00.858667-1.2640741.1148700.43477743.59907437.14897537.148975-6.450099
11.291275-0.9642050.0717600.27160633.32261329.51165429.511654-3.810959
21.067558-1.0616340.2173480.11782012.92842913.25748613.2574860.329057
30.0710200.921575-0.3768300.91998356.76209161.82045461.8204545.058363
40.2754070.186325-1.1398060.141805-28.240755-21.923992-21.9239926.316763
\n", + "
" + ], + "text/plain": [ + " 0 1 2 3 y pred_fit pred_dot \\\n", + "0 0.858667 -1.264074 1.114870 0.434777 43.599074 37.148975 37.148975 \n", + "1 1.291275 -0.964205 0.071760 0.271606 33.322613 29.511654 29.511654 \n", + "2 1.067558 -1.061634 0.217348 0.117820 12.928429 13.257486 13.257486 \n", + "3 0.071020 0.921575 -0.376830 0.919983 56.762091 61.820454 61.820454 \n", + "4 0.275407 0.186325 -1.139806 0.141805 -28.240755 -21.923992 -21.923992 \n", + "\n", + " residual \n", + "0 -6.450099 \n", + "1 -3.810959 \n", + "2 0.329057 \n", + "3 5.058363 \n", + "4 6.316763 " + ] + }, + "execution_count": 46, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df['residual'] = df['pred_fit'] - df['y']\n", + "df.head()" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "jGVAfwy7AR7I" + }, + "source": [ + "И на всех объектах считаем метрику MSE - mean squared error, напомню, что более подробно про неё рассказываю в этом [видео](https://youtu.be/vh2smjQyhp8) и в этом [ноутбуке](https://colab.research.google.com/drive/14Oxi6sI25mP4JbovLiJ57e7H5sbN2I3p)." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "USkbwCNVAR7I" + }, + "source": [ + "MSE равняется." + ] + }, + { + "cell_type": "code", + "execution_count": 47, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "oVK_d05wAR7J", + "outputId": "a9087eb5-0879-4b4b-9562-ad8681386a65", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "92.64429127220508" + ] + }, + "execution_count": 47, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "np.mean(df['residual'] ** 2)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": { + "id": "Tfem6RubAMjf" + }, + "source": [ + "##### Своя реализация линейной регрессии" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "zL6O2KJQCPk_" + }, + "source": [ + "Берем те же самые данные, где брали 4 признака, но еще возвращаем веса при признаках, а свободный вес по умолчанию в такой генерации равен 0." + ] + }, + { + "cell_type": "code", + "execution_count": 48, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/", + "height": 1000 + }, + "id": "FIviYjjJCPlA", + "outputId": "8245f99b-6432-4137-94d3-c57e67121077", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "array([[ 0.85866717, -1.26407368, 1.11487028, 0.43477699],\n", + " [ 1.29127473, -0.96420485, 0.07175977, 0.2716063 ],\n", + " [ 1.06755846, -1.06163445, 0.21734821, 0.1178195 ],\n", + " [ 0.07101978, 0.92157523, -0.37682984, 0.91998254],\n", + " [ 0.27540666, 0.18632534, -1.13980565, 0.14180489],\n", + " [ 0.29634711, 1.40277112, -1.54686257, 1.29561858],\n", + " [-1.68728061, -1.69734212, -0.41145394, -0.04527514],\n", + " [ 0.5936862 , 0.37050633, 1.34537807, 1.01594215],\n", + " [-0.86335252, -0.13054147, -0.52308763, -0.25127692],\n", + " [ 0.65402488, 1.79948007, 1.5466061 , 1.60987398],\n", + " [ 1.0956297 , -0.30957664, 0.72575222, 1.54907163],\n", + " [-0.39117313, 1.53422235, -0.16419295, 0.36036665],\n", + " [ 0.68731235, -1.82300958, 0.8791138 , 1.84636487],\n", + " [-1.0616544 , -0.68448467, -0.47621448, 0.83031043],\n", + " [-1.1288944 , 0.01699688, -0.42442882, -0.1329099 ],\n", + " [ 0.51002802, 0.33871394, -1.17212003, -1.04596765],\n", + " [ 1.08771086, 0.53382172, 0.39521201, 0.12286753],\n", + " [-1.55107946, 0.94303598, 0.34115344, 0.13827322],\n", + " [-1.57749431, 1.31094364, -0.79286501, -0.07174941],\n", + " [-1.53214252, 0.21886858, 0.18566325, 1.83277654],\n", + " [ 1.20910164, -0.8430661 , -0.14189358, 0.38535414],\n", + " [ 1.65920462, 0.37864068, -0.46456606, 0.15384125],\n", + " [-1.44071935, 1.47651282, -0.13155348, 0.1944292 ],\n", + " [-0.00828463, -0.31963136, -0.53662936, 0.31540267],\n", + " [-0.37842255, -0.48897544, -0.64439382, 0.69914084],\n", + " [-0.23725045, -1.23234621, -0.17241977, 0.09183837],\n", + " [-0.18577532, -0.38053642, 0.08897764, 0.06367166],\n", + " [ 1.4924715 , -1.11523722, -0.70541403, -0.04723257],\n", + " [ 0.51655239, -0.08940364, 0.68212971, 0.15072201],\n", + " [ 1.74945474, -0.286073 , -0.48456513, -2.65331856],\n", + " [ 2.15667443, -0.82943725, -0.52937203, 1.56170369],\n", + " [-1.08019383, -0.43205762, 0.51608404, 0.45539286],\n", + " [-0.17809318, -0.57395456, -0.20437532, -0.4864951 ],\n", + " [-0.53085824, -0.86986194, -1.15526422, 0.79667185],\n", + " [ 0.76616062, -0.99402769, -0.26434233, 1.54220922],\n", + " [ 0.85615205, -0.04480262, -0.47748923, -0.15406552],\n", + " [ 0.68968231, 0.56119218, -1.30554851, -1.11947526],\n", + " [ 0.87427277, 0.0716521 , -1.63905163, -0.64730263],\n", + " [-1.29742262, -0.71496244, 0.51447963, 0.25771638],\n", + " [-1.68411089, -1.18575527, 0.60010201, 0.69556726],\n", + " [ 0.63007982, 0.07349324, 0.73227135, -0.64257539],\n", + " [-0.10514925, -1.58396258, -1.37177369, -0.02831834],\n", + " [-2.04905726, 0.86705521, -0.26196107, 0.57897111],\n", + " [ 0.42105072, -1.06560298, -0.88623967, -0.47573349],\n", + " [-0.49673048, 0.50502192, 0.93878313, -0.67502027],\n", + " [-0.06766856, -0.41320975, 0.1200828 , -0.69897169],\n", + " [ 0.73683739, 1.57463407, -0.03107509, -0.68344663],\n", + " [ 0.59527845, -0.68280162, -0.71355993, -1.90828954],\n", + " [ 0.81776957, 0.03679475, -0.04870254, 1.7915311 ],\n", + " [ 2.20185631, -0.0370669 , 1.93290543, -1.99357153]])" + ] + }, + "metadata": {}, + "output_type": "display_data" + }, + { + "data": { + "text/plain": [ + "array([ 43.59907368, 33.3226129 , 12.92842886, 56.76209111,\n", + " -28.24075472, 64.36182392, -220.93063391, 134.81614163,\n", + " -111.85450024, 244.9327123 , 106.23869476, 83.15972598,\n", + " 22.1607008 , -87.67552386, -94.67026039, -29.62752165,\n", + " 119.90179833, -16.36526242, -71.2734975 , -33.77825083,\n", + " 24.31113443, 102.14682115, 1.12585934, -48.81175726,\n", + " -58.59186113, -111.47215424, -12.5784088 , -14.21337533,\n", + " 64.61172215, 10.81251385, 99.11401244, -75.98950916,\n", + " -52.77978396, -112.95415032, 7.45744433, 33.69756994,\n", + " -24.66640928, -35.64805852, -76.68888106, -129.08694753,\n", + " 59.65011241, -158.52958483, -61.09970272, -97.83194751,\n", + " 36.42924987, -49.96145024, 104.10943674, -80.90767725,\n", + " 99.76081282, 152.70106779])" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "X, y, coeffs = make_regression(n_samples=50, n_features=4, n_informative=4,\n", + " noise=10, coef=True, random_state=11)\n", + "\n", + "display(X, y)" + ] + }, + { + "cell_type": "code", + "execution_count": 49, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "tFAeNpTVCPlB", + "outputId": "cf0a71d1-f68b-492e-88df-04474120e694", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "array([59.32158596, 58.74342238, 44.07539836, 25.03682142])" + ] + }, + "execution_count": 49, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "coeffs" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "-jcBg1trGk5C" + }, + "source": [ + "Для удобства реализации градиентного спуска от записи поэлементной через сумму ($MSE = \\frac{1}{n}\\sum_{i=0}^n{(\\text{y}_i-\\text{y_pred}_i})^2$) перейдем к матричной форме записи.\n", + "\n", + "Предсказания линейной модели - это перемножение весов на признаки плюс свободный вес.\n", + "\n", + "$$y_{pred} = X\\cdot w + w_0$$\n", + "\n", + "При этом очень важно, чтобы соблюдались размерности матрицы $X$ и вектора $w$.\n", + "У нас размерности равны" + ] + }, + { + "cell_type": "code", + "execution_count": 50, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "EQUqgDEnHRiP", + "outputId": "0d4bdb56-6ed3-4663-b396-1c9b9aa2eeb5", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "((50, 4), (4,))" + ] + }, + "execution_count": 50, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "X.shape, coeffs.shape" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "d8T_yqOeHX8G" + }, + "source": [ + "А значит, чтобы объеты могли матрично перемножиться, нужно чтобы количество столбцов первой матрицы было равно количеству строк второй (но у нас не матрица, а вектор).\n", + "\n", + "У нас совпадают, так что можем их перемножать и получаем ничто иное, как *скалярное произведение* - все значения в признаках перемножаются на соответсвующие веса и складываются.\n", + "\n", + "\n", + "А значит можем переписать формулу:\n", + "$$y_{pred} = \\langle X, w\\rangle + w_0$$\n", + "\n", + "\n", + "Но вот только мешается свободный вес. Можно пойти на одну хитрость и добавить фиктивный признак в данные, который для каждого объекта равен 1.\n", + "\n" + ] + }, + { + "cell_type": "code", + "execution_count": 51, + "metadata": { + "id": "qRd4q1PYIG-_", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "array([[ 0.85866717, -1.26407368, 1.11487028, 0.43477699, 1. ],\n", + " [ 1.29127473, -0.96420485, 0.07175977, 0.2716063 , 1. ],\n", + " [ 1.06755846, -1.06163445, 0.21734821, 0.1178195 , 1. ],\n", + " [ 0.07101978, 0.92157523, -0.37682984, 0.91998254, 1. ],\n", + " [ 0.27540666, 0.18632534, -1.13980565, 0.14180489, 1. ],\n", + " [ 0.29634711, 1.40277112, -1.54686257, 1.29561858, 1. ],\n", + " [-1.68728061, -1.69734212, -0.41145394, -0.04527514, 1. ],\n", + " [ 0.5936862 , 0.37050633, 1.34537807, 1.01594215, 1. ],\n", + " [-0.86335252, -0.13054147, -0.52308763, -0.25127692, 1. ],\n", + " [ 0.65402488, 1.79948007, 1.5466061 , 1.60987398, 1. ],\n", + " [ 1.0956297 , -0.30957664, 0.72575222, 1.54907163, 1. ],\n", + " [-0.39117313, 1.53422235, -0.16419295, 0.36036665, 1. ],\n", + " [ 0.68731235, -1.82300958, 0.8791138 , 1.84636487, 1. ],\n", + " [-1.0616544 , -0.68448467, -0.47621448, 0.83031043, 1. ],\n", + " [-1.1288944 , 0.01699688, -0.42442882, -0.1329099 , 1. ],\n", + " [ 0.51002802, 0.33871394, -1.17212003, -1.04596765, 1. ],\n", + " [ 1.08771086, 0.53382172, 0.39521201, 0.12286753, 1. ],\n", + " [-1.55107946, 0.94303598, 0.34115344, 0.13827322, 1. ],\n", + " [-1.57749431, 1.31094364, -0.79286501, -0.07174941, 1. ],\n", + " [-1.53214252, 0.21886858, 0.18566325, 1.83277654, 1. ],\n", + " [ 1.20910164, -0.8430661 , -0.14189358, 0.38535414, 1. ],\n", + " [ 1.65920462, 0.37864068, -0.46456606, 0.15384125, 1. ],\n", + " [-1.44071935, 1.47651282, -0.13155348, 0.1944292 , 1. ],\n", + " [-0.00828463, -0.31963136, -0.53662936, 0.31540267, 1. ],\n", + " [-0.37842255, -0.48897544, -0.64439382, 0.69914084, 1. ],\n", + " [-0.23725045, -1.23234621, -0.17241977, 0.09183837, 1. ],\n", + " [-0.18577532, -0.38053642, 0.08897764, 0.06367166, 1. ],\n", + " [ 1.4924715 , -1.11523722, -0.70541403, -0.04723257, 1. ],\n", + " [ 0.51655239, -0.08940364, 0.68212971, 0.15072201, 1. ],\n", + " [ 1.74945474, -0.286073 , -0.48456513, -2.65331856, 1. ],\n", + " [ 2.15667443, -0.82943725, -0.52937203, 1.56170369, 1. ],\n", + " [-1.08019383, -0.43205762, 0.51608404, 0.45539286, 1. ],\n", + " [-0.17809318, -0.57395456, -0.20437532, -0.4864951 , 1. ],\n", + " [-0.53085824, -0.86986194, -1.15526422, 0.79667185, 1. ],\n", + " [ 0.76616062, -0.99402769, -0.26434233, 1.54220922, 1. ],\n", + " [ 0.85615205, -0.04480262, -0.47748923, -0.15406552, 1. ],\n", + " [ 0.68968231, 0.56119218, -1.30554851, -1.11947526, 1. ],\n", + " [ 0.87427277, 0.0716521 , -1.63905163, -0.64730263, 1. ],\n", + " [-1.29742262, -0.71496244, 0.51447963, 0.25771638, 1. ],\n", + " [-1.68411089, -1.18575527, 0.60010201, 0.69556726, 1. ],\n", + " [ 0.63007982, 0.07349324, 0.73227135, -0.64257539, 1. ],\n", + " [-0.10514925, -1.58396258, -1.37177369, -0.02831834, 1. ],\n", + " [-2.04905726, 0.86705521, -0.26196107, 0.57897111, 1. ],\n", + " [ 0.42105072, -1.06560298, -0.88623967, -0.47573349, 1. ],\n", + " [-0.49673048, 0.50502192, 0.93878313, -0.67502027, 1. ],\n", + " [-0.06766856, -0.41320975, 0.1200828 , -0.69897169, 1. ],\n", + " [ 0.73683739, 1.57463407, -0.03107509, -0.68344663, 1. ],\n", + " [ 0.59527845, -0.68280162, -0.71355993, -1.90828954, 1. ],\n", + " [ 0.81776957, 0.03679475, -0.04870254, 1.7915311 , 1. ],\n", + " [ 2.20185631, -0.0370669 , 1.93290543, -1.99357153, 1. ]])" + ] + }, + "execution_count": 51, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "X = np.column_stack([X, np.ones((50))])\n", + "X" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "HmRcuBRDIS0y" + }, + "source": [ + "И теперь всё предсказание линейной модели будет равняться:\n", + "\n", + "$$y_{pred} = \\langle X, w\\rangle$$\n", + "\n", + "\n", + "А наша ошибка MSE преобразиться и будет выглядить следующим образом:\n", + "\n", + "$$MSE = \\frac{1}{n}\\sum^{n}_{i=1}(y_{i} - \\text{y_pred}_i)^{2} = \\frac{1}{n}\\sum^{n}_{i=1}(y_{i} - \\langle X_i, w\\rangle)^{2} = \\frac{1}{n}||Y - X w||^{2}$$\n", + "\n", + "\n", + "где используется $L_{2}$ норма:\n", + "\n", + "$$||Y - X w|| = \\sqrt{\\sum_{i=1}^n{(y_i-X_iw)^2}} $$\n", + "\n", + "$$MSE = \\frac{1}{n}\\sqrt{\\sum_{i=1}^n{(y_i-X_iw)^2}} ^{2} = \\frac{1}{n}\\sum_{i=1}^n{(y_i-X_iw)^2}$$\n", + "\n" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "yjbmJkF4CPlC" + }, + "source": [ + "Реализуем две функции только уже с матричными операциями:\n", + "1. mserror_mat - функция среднеквадратичной ошибки для матриц\n", + "\n", + "\n", + "2. gr_mserror_mat - градиент функции MSE для матрицы:\n", + "\n", + "$\\frac{∂ MSE}{∂ w} = \\frac{1 \\cdot 2}{n}({Y - Xw}) \\cdot-X$\n", + "\n" + ] + }, + { + "cell_type": "code", + "execution_count": 52, + "metadata": { + "id": "_GlN3Fb4CPlC", + "tags": [] + }, + "outputs": [], + "source": [ + "# функция, определяющая среднеквадратичную ошибку\n", + "def mserror_mat(X, w, y):\n", + " y_pred = X @ w\n", + " return np.sum((y - y_pred) ** 2) / len(y_pred)\n", + "\n", + "# функция градиента\n", + "def gr_mserror_mat(X, w, y):\n", + " y_pred = X @ w\n", + " return 2/len(X)*(y - y_pred) @ (-X)\n" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "siwPK0oQCPlC" + }, + "source": [ + "И остается запустить цикл градиентного спуска.\n", + "\n", + "В начале инициализировали коэффициенты. Т.к. у нас 5 признаков (4 настоящих плюс один фиктивный), то будет 5 весов." + ] + }, + { + "cell_type": "code", + "execution_count": 53, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "PBs-gz9sK9Eo", + "outputId": "4eefc925-6d0d-48be-80fb-76411c4d673f", + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "array([0., 0., 0., 0., 0.])" + ] + }, + "execution_count": 53, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "# первоначальное точка\n", + "weights = np.zeros(X.shape[1])\n", + "weights" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "vfDPdqojLykB" + }, + "source": [ + "Затем запускаем цикл по обучению и меняем веса, при этом не каждый вес отдельно, а все веса сразу вместе.\n", + "\n", + "И если веса начнут плохо изменяться, то можем выйти по критерию останова:\n", + "\n", + "$$||w_{new} - w_{old}|| ≤ eps$$" + ] + }, + { + "cell_type": "code", + "execution_count": 54, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "hsA08x8UCPlC", + "outputId": "65060637-1a17-45cc-f4fd-12ee2543280e", + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Итерация: 0\n", + "Текущая точка [0. 0. 0. 0. 0.]| Следующая точка [11.76469989 8.02019663 7.1529662 3.12227706 -0.71246521]\n", + "MSE 7901.284047919272\n", + "--------------------------------------------------------\n", + "Итерация: 1\n", + "Текущая точка [11.76469989 8.02019663 7.1529662 3.12227706 -0.71246521]| Следующая точка [21.07996752 15.00192791 13.15169841 5.97919733 -1.2826889 ]\n", + "MSE 5491.413352110748\n", + "--------------------------------------------------------\n", + "Итерация: 2\n", + "Текущая точка [21.07996752 15.00192791 13.15169841 5.97919733 -1.2826889 ]| Следующая точка [28.48213061 21.0576616 18.18254548 8.55326802 -1.72604536]\n", + "MSE 3846.369420368778\n", + "--------------------------------------------------------\n", + "Итерация: 3\n", + "Текущая точка [28.48213061 21.0576616 18.18254548 8.55326802 -1.72604536]| Следующая точка [34.38479911 26.29452131 22.40202941 10.84471509 -2.06001325]\n", + "MSE 2714.9929661406427\n", + "--------------------------------------------------------\n", + "Итерация: 4\n", + "Текущая точка [34.38479911 26.29452131 22.40202941 10.84471509 -2.06001325]| Следующая точка [39.10795216 30.8120046 25.94151547 12.86498442 -2.30214304]\n", + "MSE 1931.9222400828064\n", + "--------------------------------------------------------\n", + "Итерация: 5\n", + "Текущая точка [39.10795216 30.8120046 25.94151547 12.86498442 -2.30214304]| Следующая точка [42.8999458 34.70086936 28.91118413 14.6321765 -2.46889448]\n", + "MSE 1387.0040664906423\n", + "--------------------------------------------------------\n", + "Итерация: 6\n", + "Текущая точка [42.8999458 34.70086936 28.91118413 14.6321765 -2.46889448]| Следующая точка [45.95419736 38.04279216 31.40339917 16.16788817 -2.57504099]\n", + "MSE 1006.0899187520283\n", + "--------------------------------------------------------\n", + "Итерация: 7\n", + "Текущая точка [45.95419736 38.04279216 31.40339917 16.16788817 -2.57504099]| Следующая точка [48.42186138 40.91052058 33.49555668 17.49507148 -2.63343403]\n", + "MSE 738.8060039075306\n", + "--------------------------------------------------------\n", + "Итерация: 8\n", + "Текущая точка [48.42186138 40.91052058 33.49555668 17.49507148 -2.63343403]| Следующая точка [50.42148205 43.36832699 35.25248994 18.63662244 -2.65498752]\n", + "MSE 550.6561006176497\n", + "--------------------------------------------------------\n", + "Итерация: 9\n", + "Текущая точка [50.42148205 43.36832699 35.25248994 18.63662244 -2.65498752]| Следующая точка [52.04636149 45.47263149 36.7284959 19.61448849 -2.64878917]\n", + "MSE 417.85498691229355\n", + "--------------------------------------------------------\n", + "Итерация: 10\n", + "Текущая точка [52.04636149 45.47263149 36.7284959 19.61448849 -2.64878917]| Следующая точка [53.37019893 47.27270499 37.96904019 20.44914032 -2.62227769]\n", + "MSE 323.90720485464516\n", + "--------------------------------------------------------\n", + "Итерация: 11\n", + "Текущая точка [53.37019893 47.27270499 37.96904019 20.44914032 -2.62227769]| Следующая точка [54.45141845 48.81139396 39.01219008 21.1592957 -2.58144728]\n", + "MSE 257.3166668961423\n", + "--------------------------------------------------------\n", + "Итерация: 12\n", + "Текущая точка [54.45141845 48.81139396 39.01219008 21.1592957 -2.58144728]| Следующая точка [55.33650004 50.12582934 39.88981729 21.76181406 -2.53105516]\n", + "MSE 210.038369394656\n", + "--------------------------------------------------------\n", + "Итерация: 13\n", + "Текущая точка [55.33650004 50.12582934 39.88981729 21.76181406 -2.53105516]| Следующая точка [56.06255115 51.24809716 40.62860694 22.27170356 -2.47481859]\n", + "MSE 176.4228514139174\n", + "--------------------------------------------------------\n", + "Итерация: 14\n", + "Текущая точка [56.06255115 51.24809716 40.62860694 22.27170356 -2.47481859]| Следующая точка [56.65929839 52.20585828 41.25090327 22.70219922 -2.41559373]\n", + "MSE 152.4912980600221\n", + "--------------------------------------------------------\n", + "Итерация: 15\n", + "Текущая точка [56.65929839 52.20585828 41.25090327 22.70219922 -2.41559373]| Следующая точка [57.15063499 53.02291165 41.77541792 23.06488303 -2.35553336]\n", + "MSE 135.4345952200435\n", + "--------------------------------------------------------\n", + "Итерация: 16\n", + "Текущая точка [57.15063499 53.02291165 41.77541792 23.06488303 -2.35553336]| Следующая точка [57.55582741 53.71969964 42.21782313 23.3698259 -2.29622284]\n", + "MSE 123.26530927825932\n", + "--------------------------------------------------------\n", + "Итерация: 17\n", + "Текущая точка [57.55582741 53.71969964 42.21782313 23.3698259 -2.29622284]| Следующая точка [57.89045924 54.31375717 42.59124804 23.62573786 -2.2387952 ]\n", + "MSE 114.57482521743945\n", + "--------------------------------------------------------\n", + "Итерация: 18\n", + "Текущая точка [57.89045924 54.31375717 42.59124804 23.62573786 -2.2387952 ]| Следующая точка [58.16717236 54.82010769 42.90669406 23.84011751 -2.18402727]\n", + "MSE 108.36322966694733\n", + "--------------------------------------------------------\n", + "Итерация: 19\n", + "Текущая точка [58.16717236 54.82010769 42.90669406 23.84011751 -2.18402727]| Следующая точка [58.39625082 55.25161031 43.17338224 24.01939505 -2.13241891]\n", + "MSE 103.91977162382656\n", + "--------------------------------------------------------\n", + "Итерация: 20\n", + "Текущая точка [58.39625082 55.25161031 43.17338224 24.01939505 -2.13241891]| Следующая точка [58.58608266 55.61926249 43.39904384 24.16906562 -2.08425763]\n", + "MSE 100.73863892376886\n", + "--------------------------------------------------------\n", + "Итерация: 21\n", + "Текущая точка [58.58608266 55.61926249 43.39904384 24.16906562 -2.08425763]| Следующая точка [58.74352627 55.93246299 43.59016329 24.29381107 -2.03967075]\n", + "MSE 98.45948265070291\n", + "--------------------------------------------------------\n", + "Итерация: 22\n", + "Текущая точка [58.74352627 55.93246299 43.59016329 24.29381107 -2.03967075]| Следующая точка [58.87420226 56.1992396 43.75218136 24.39760973 -1.99866711]\n", + "MSE 96.82533656557291\n", + "--------------------------------------------------------\n", + "Итерация: 23\n", + "Текущая точка [58.87420226 56.1992396 43.75218136 24.39760973 -1.99866711]| Следующая точка [58.98272662 56.42644562 43.88966508 24.48383401 -1.96117004]\n", + "MSE 95.65279460128872\n", + "--------------------------------------------------------\n", + "Итерация: 24\n", + "Текущая точка [58.98272662 56.42644562 43.88966508 24.48383401 -1.96117004]| Следующая точка [59.07289774 56.61992931 44.00644977 24.55533657 -1.92704328]\n", + "MSE 94.81084525169739\n", + "--------------------------------------------------------\n", + "Итерация: 25\n", + "Текущая точка [59.07289774 56.61992931 44.00644977 24.55533657 -1.92704328]| Следующая точка [59.14784688 56.78467946 44.10575783 24.61452568 -1.89611097]\n", + "MSE 94.20583098575997\n", + "--------------------------------------------------------\n", + "Итерация: 26\n", + "Текущая точка [59.14784688 56.78467946 44.10575783 24.61452568 -1.89611097]| Следующая точка [59.21015955 56.9249504 44.19029817 24.66343085 -1.86817307]\n", + "MSE 93.77074823912531\n", + "--------------------------------------------------------\n", + "Итерация: 27\n", + "Текущая точка [59.21015955 56.9249504 44.19029817 24.66343085 -1.86817307]| Следующая точка [59.26197383 57.04436924 44.26234925 24.70375952 -1.8430169 ]\n", + "MSE 93.45762768740872\n", + "--------------------------------------------------------\n", + "Итерация: 28\n", + "Текущая точка [59.26197383 57.04436924 44.26234925 24.70375952 -1.8430169 ]| Следующая точка [59.3050602 57.14602762 44.32382866 24.73694599 -1.82042578]\n", + "MSE 93.23210310542908\n", + "--------------------------------------------------------\n", + "Итерация: 29\n", + "Текущая точка [59.3050602 57.14602762 44.32382866 24.73694599 -1.82042578]| Следующая точка [59.34088647 57.23256032 44.37635126 24.76419334 -1.8001853 ]\n", + "MSE 93.06953693827623\n", + "--------------------------------------------------------\n", + "Итерация: 30\n", + "Текущая точка [59.34088647 57.23256032 44.37635126 24.76419334 -1.8001853 ]| Следующая точка [59.3706709 57.30621236 44.42127792 24.78650929 -1.78208767]\n", + "MSE 92.95225422283875\n", + "--------------------------------------------------------\n", + "Итерация: 31\n", + "Текущая точка [59.3706709 57.30621236 44.42127792 24.78650929 -1.78208767]| Следующая точка [59.39542553 57.36889645 44.45975624 24.80473686 -1.76593481]\n", + "MSE 92.86756633726901\n", + "--------------------------------------------------------\n", + "Итерация: 32\n", + "Текущая точка [59.39542553 57.36889645 44.45975624 24.80473686 -1.76593481]| Следующая точка [59.41599184 57.42224197 44.49275474 24.8195803 -1.75154016]\n", + "MSE 92.80635805630789\n", + "--------------------------------------------------------\n", + "Итерация: 33\n", + "Текущая точка [59.41599184 57.42224197 44.49275474 24.8195803 -1.75154016]| Следующая точка [59.43306995 57.46763676 44.5210914 24.83162725 -1.73872982]\n", + "MSE 92.76207666444269\n", + "--------------------------------------------------------\n", + "Итерация: 34\n", + "Текущая точка [59.43306995 57.46763676 44.5210914 24.83162725 -1.73872982]| Следующая точка [59.44724279 57.50626287 44.54545765 24.84136737 -1.727343 ]\n", + "MSE 92.73000824392085\n", + "--------------------------------------------------------\n", + "Итерация: 35\n", + "Текущая точка [59.44724279 57.50626287 44.54545765 24.84136737 -1.727343 ]| Следующая точка [59.45899592 57.53912698 44.56643846 24.84920822 -1.71723203]\n", + "MSE 92.70675922222419\n", + "--------------------------------------------------------\n", + "Итерация: 36\n", + "Текущая точка [59.45899592 57.53912698 44.56643846 24.84920822 -1.71723203]| Следующая точка [59.46873398 57.56708635 44.58452915 24.85548855 -1.70826207]\n", + "MSE 92.68988472679756\n", + "--------------------------------------------------------\n", + "Итерация: 37\n", + "Текущая точка [59.46873398 57.56708635 44.58452915 24.85548855 -1.70826207]| Следующая точка [59.47679431 57.59087096 44.60014958 24.86048955 -1.70031058]\n", + "MSE 92.67762200788442\n", + "--------------------------------------------------------\n", + "Итерация: 38\n", + "Текущая точка [59.47679431 57.59087096 44.60014958 24.86048955 -1.70031058]| Следующая точка [59.48345818 57.61110234 44.61365591 24.86444433 -1.69326667]\n", + "MSE 92.66869910455937\n", + "--------------------------------------------------------\n", + "Итерация: 39\n", + "Текущая точка [59.48345818 57.61110234 44.61365591 24.86444433 -1.69326667]| Следующая точка [59.48896018 57.62830972 44.62535067 24.86754585 -1.68703034]\n", + "MSE 92.66219742859573\n", + "--------------------------------------------------------\n", + "Итерация: 40\n", + "Текущая точка [59.48896018 57.62830972 44.62535067 24.86754585 -1.68703034]| Следующая точка [59.49349594 57.64294363 44.63549103 24.8699536 -1.68151169]\n", + "MSE 92.65745300854614\n", + "--------------------------------------------------------\n", + "Итерация: 41\n", + "Текущая точка [59.49349594 57.64294363 44.63549103 24.8699536 -1.68151169]| Следующая точка [59.49722865 57.65538766 44.64429587 24.87179919 -1.67663011]\n", + "MSE 92.65398547098278\n", + "--------------------------------------------------------\n", + "Итерация: 42\n", + "Текущая точка [59.49722865 57.65538766 44.64429587 24.87179919 -1.67663011]| Следующая точка [59.50029441 57.66596832 44.65195173 24.87319104 -1.67231349]\n", + "MSE 92.65144693426757\n", + "--------------------------------------------------------\n", + "Итерация: 43\n", + "Текущая точка [59.50029441 57.66596832 44.65195173 24.87319104 -1.67231349]| Следующая точка [59.5028067 57.67496359 44.65861769 24.8742183 -1.66849746]\n", + "MSE 92.64958520640201\n", + "--------------------------------------------------------\n", + "Итерация: 44\n", + "Текущая точка [59.5028067 57.67496359 44.65861769 24.8742183 -1.66849746]| Следующая точка [59.50486012 57.68261005 44.66442966 24.87495413 -1.66512467]\n", + "MSE 92.64821726459807\n", + "--------------------------------------------------------\n", + "Итерация: 45\n", + "Текущая точка [59.50486012 57.68261005 44.66442966 24.87495413 -1.66512467]| Следующая точка [59.50653352 57.68910909 44.66950384 24.87545843 -1.66214407]\n", + "MSE 92.64721013003997\n", + "--------------------------------------------------------\n", + "Итерация: 46\n", + "Текущая точка [59.50653352 57.68910909 44.66950384 24.87545843 -1.66214407]| Следующая точка [59.50789259 57.6946321 44.67393975 24.87578011 -1.65951032]\n", + "MSE 92.64646706515495\n", + "--------------------------------------------------------\n", + "Итерация: 47\n", + "Текущая точка [59.50789259 57.6946321 44.67393975 24.87578011 -1.65951032]| Следующая точка [59.50899202 57.69932497 44.6778227 24.87595901 -1.65718319]\n", + "MSE 92.64591760420645\n", + "--------------------------------------------------------\n", + "Итерация: 48\n", + "Текущая точка [59.50899202 57.69932497 44.6778227 24.87595901 -1.65718319]| Следующая точка [59.50987733 57.70331183 44.68122591 24.87602749 -1.65512699]\n", + "MSE 92.64551034659182\n", + "--------------------------------------------------------\n", + "Итерация: 49\n", + "Текущая точка [59.50987733 57.70331183 44.68122591 24.87602749 -1.65512699]| Следующая точка [59.51058637 57.70669831 44.68421236 24.87601171 -1.65331012]\n", + "MSE 92.645207742673\n", + "--------------------------------------------------------\n", + "Итерация: 50\n", + "Текущая точка [59.51058637 57.70669831 44.68421236 24.87601171 -1.65331012]| Следующая точка [59.5111506 57.70957431 44.68683624 24.87593277 -1.65170463]\n", + "MSE 92.64498231774262\n", + "--------------------------------------------------------\n", + "Итерация: 51\n", + "Текущая точка [59.5111506 57.70957431 44.68683624 24.87593277 -1.65170463]| Следующая точка [59.51159614 57.7120163 44.68914426 24.87580759 -1.65028579]\n", + "MSE 92.6448139347927\n", + "--------------------------------------------------------\n", + "Итерация: 52\n", + "Текущая точка [59.51159614 57.7120163 44.68914426 24.87580759 -1.65028579]| Следующая точка [59.51194465 57.71408934 44.69117675 24.87564965 -1.64903173]\n", + "MSE 92.6446878082462\n", + "--------------------------------------------------------\n", + "Итерация: 53\n", + "Текущая точка [59.51194465 57.71408934 44.69117675 24.87564965 -1.64903173]| Следующая точка [59.51221409 57.71584881 44.69296856 24.87546966 -1.64792314]\n", + "MSE 92.64459306103737\n", + "--------------------------------------------------------\n", + "Итерация: 54\n", + "Текущая точка [59.51221409 57.71584881 44.69296856 24.87546966 -1.64792314]| Следующая точка [59.5124193 57.71734177 44.69454986 24.87527603 -1.64694298]\n", + "MSE 92.64452167517669\n", + "--------------------------------------------------------\n", + "Итерация: 55\n", + "Текущая точка [59.5124193 57.71734177 44.69454986 24.87527603 -1.64694298]| Следующая точка [59.51257255 57.71860828 44.6959468 24.87507531 -1.64607619]\n", + "MSE 92.64446772754471\n", + "--------------------------------------------------------\n", + "Итерация: 56\n", + "Текущая точка [59.51257255 57.71860828 44.6959468 24.87507531 -1.64607619]| Следующая точка [59.51268398 57.7196824 44.69718209 24.87487257 -1.64530948]\n", + "MSE 92.64442683265162\n", + "--------------------------------------------------------\n", + "Итерация: 57\n", + "Текущая точка [59.51268398 57.7196824 44.69718209 24.87487257 -1.64530948]| Следующая точка [59.5127619 57.72059311 44.69827546 24.87467163 -1.64463114]\n", + "MSE 92.64439573573438\n", + "--------------------------------------------------------\n", + "Итерация: 58\n", + "Текущая точка [59.5127619 57.72059311 44.69827546 24.87467163 -1.64463114]| Следующая точка [59.51281319 57.72136501 44.69924408 24.87447536 -1.64403083]\n", + "MSE 92.64437201518268\n", + "--------------------------------------------------------\n", + "Итерация: 59\n", + "Текущая точка [59.51281319 57.72136501 44.69924408 24.87447536 -1.64403083]| Следующая точка [59.51284344 57.72201907 44.70010292 24.87428582 -1.64349942]\n", + "MSE 92.64435386456748\n", + "--------------------------------------------------------\n", + "Итерация: 60\n", + "Текущая точка [59.51284344 57.72201907 44.70010292 24.87428582 -1.64349942]| Следующая точка [59.51285724 57.72257307 44.70086505 24.87410447 -1.64302888]\n", + "MSE 92.64433993270397\n", + "--------------------------------------------------------\n", + "Итерация: 61\n", + "Текущая точка [59.51285724 57.72257307 44.70086505 24.87410447 -1.64302888]| Следующая точка [59.51285835 57.72304216 44.70154189 24.87393226 -1.6426121 ]\n", + "MSE 92.64432920608364\n", + "--------------------------------------------------------\n", + "Итерация: 62\n", + "Текущая точка [59.51285835 57.72304216 44.70154189 24.87393226 -1.6426121 ]| Следующая точка [59.51284979 57.72343918 44.70214342 24.87376976 -1.64224283]\n", + "MSE 92.644320922282\n", + "--------------------------------------------------------\n", + "Итерация: 63\n", + "Текущая точка [59.51284979 57.72343918 44.70214342 24.87376976 -1.64224283]| Следующая точка [59.51283403 57.72377508 44.7026784 24.87361724 -1.64191556]\n", + "MSE 92.64431450605201\n", + "--------------------------------------------------------\n", + "Итерация: 64\n", + "Текущая точка [59.51283403 57.72377508 44.7026784 24.87361724 -1.64191556]| Следующая точка [59.51281304 57.72405912 44.70315452 24.87347473 -1.6416254 ]\n", + "MSE 92.64430952205504\n", + "--------------------------------------------------------\n", + "Итерация: 65\n", + "Текущая точка [59.51281304 57.72405912 44.70315452 24.87347473 -1.6416254 ]| Следующая точка [59.51278841 57.7242992 44.70357851 24.87334211 -1.64136808]\n", + "MSE 92.64430563981963\n", + "--------------------------------------------------------\n", + "Итерация: 66\n", + "Текущая точка [59.51278841 57.7242992 44.70357851 24.87334211 -1.64136808]| Следующая точка [59.5127614 57.72450202 44.70395632 24.87321911 -1.64113979]\n", + "MSE 92.64430260770115\n", + "--------------------------------------------------------\n", + "Итерация: 67\n", + "Текущая точка [59.5127614 57.72450202 44.70395632 24.87321911 -1.64113979]| Следующая точка [59.51273299 57.72467326 44.70429315 24.87310537 -1.64093719]\n", + "MSE 92.64430023348214\n", + "--------------------------------------------------------\n", + "Итерация: 68\n", + "Текущая точка [59.51273299 57.72467326 44.70429315 24.87310537 -1.64093719]| Следующая точка [59.51270398 57.72481775 44.70459363 24.87300046 -1.64075733]\n", + "MSE 92.64429836988138\n", + "--------------------------------------------------------\n", + "Итерация: 69\n", + "Текущая точка [59.51270398 57.72481775 44.70459363 24.87300046 -1.64075733]| Следующая точка [59.51267495 57.7249396 44.70486179 24.87290393 -1.64059761]\n", + "MSE 92.64429690370082\n", + "--------------------------------------------------------\n", + "Итерация: 70\n", + "Текущая точка [59.51267495 57.7249396 44.70486179 24.87290393 -1.64059761]| Следующая точка [59.51264637 57.72504227 44.70510124 24.87281529 -1.64045571]\n", + "MSE 92.6442957476727\n", + "--------------------------------------------------------\n", + "Итерация: 71\n", + "Текущая точка [59.51264637 57.72504227 44.70510124 24.87281529 -1.64045571]| Следующая точка [59.51261856 57.72512872 44.70531515 24.87273404 -1.64032962]\n", + "MSE 92.64429483431937\n", + "--------------------------------------------------------\n", + "Итерация: 72\n", + "Текущая точка [59.51261856 57.72512872 44.70531515 24.87273404 -1.64032962]| Следующая точка [59.51259179 57.72520146 44.70550631 24.8726597 -1.64021752]\n", + "MSE 92.64429411131276\n", + "--------------------------------------------------------\n", + "Итерация: 73\n", + "Текущая точка [59.51259179 57.72520146 44.70550631 24.8726597 -1.64021752]| Следующая точка [59.51256621 57.7252626 44.70567721 24.87259177 -1.64011783]\n", + "MSE 92.64429353795867\n", + "--------------------------------------------------------\n", + "Итерация: 74\n", + "Текущая точка [59.51256621 57.7252626 44.70567721 24.87259177 -1.64011783]| Следующая точка [59.51254194 57.72531395 44.70583007 24.87252978 -1.64002916]\n", + "MSE 92.64429308252382\n", + "--------------------------------------------------------\n", + "Итерация: 75\n", + "Текущая точка [59.51254194 57.72531395 44.70583007 24.87252978 -1.64002916]| Следующая точка [59.51251904 57.72535702 44.70596682 24.87247329 -1.63995024]\n", + "MSE 92.64429272019784\n", + "--------------------------------------------------------\n", + "Итерация: 76\n", + "Текущая точка [59.51251904 57.72535702 44.70596682 24.87247329 -1.63995024]| Следующая точка [59.51249755 57.72539312 44.70608921 24.87242186 -1.63988 ]\n", + "MSE 92.64429243153427\n", + "--------------------------------------------------------\n", + "Итерация: 77\n", + "Текущая точка [59.51249755 57.72539312 44.70608921 24.87242186 -1.63988 ]| Следующая точка [59.51247745 57.72542332 44.70619878 24.87237508 -1.63981745]\n", + "MSE 92.64429220125481\n", + "--------------------------------------------------------\n", + "Итерация: 78\n", + "Текущая точка [59.51247745 57.72542332 44.70619878 24.87237508 -1.63981745]| Следующая точка [59.51245872 57.72544857 44.7062969 24.87233258 -1.63976173]\n", + "MSE 92.6442920173288\n", + "--------------------------------------------------------\n", + "Итерация: 79\n", + "Текущая точка [59.51245872 57.72544857 44.7062969 24.87233258 -1.63976173]| Следующая точка [59.51244134 57.72546964 44.70638478 24.87229399 -1.63971209]\n", + "MSE 92.64429187026263\n", + "--------------------------------------------------------\n", + "Итерация: 80\n", + "Текущая точка [59.51244134 57.72546964 44.70638478 24.87229399 -1.63971209]| Следующая точка [59.51242524 57.72548719 44.70646353 24.87225898 -1.63966784]\n", + "MSE 92.64429175254996\n", + "--------------------------------------------------------\n" + ] + } + ], + "source": [ + "# установка минимального значения, на которое должны изменяться веса\n", + "eps = 0.0001\n", + "\n", + "# размер шага (learning rate)\n", + "learning_rate = 0.1\n", + "\n", + "next_weights = weights\n", + "# количество итерация \n", + "n = 100\n", + "for i in range(n):\n", + " cur_weights = next_weights\n", + "\n", + " # движение в негативную сторону вычисляемого градиента\n", + " next_weights = cur_weights - learning_rate * gr_mserror_mat(X, cur_weights, y)\n", + "\n", + " # остановка когда достигнута необходимая степень точности\n", + " print(f\"Итерация: {i}\")\n", + " print(f\"Текущая точка {cur_weights}| Следующая точка {next_weights}\")\n", + " print(f\"MSE {mserror_mat(X, cur_weights, y)}\")\n", + " print(\"--------------------------------------------------------\")\n", + " \n", + " if np.linalg.norm(cur_weights - next_weights, ord=2) <= eps:\n", + " break" + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "r2s0LuwhMWAg" + }, + "source": [ + "Вышли раньше из обучения, т.к. веса перестали сильно изменяться и мы стали топтаться на одном месте." + ] + }, + { + "cell_type": "markdown", + "metadata": { + "id": "3IfMej7yCPlC" + }, + "source": [ + "И получили точно такую же метрику, которая получалась у `LinearRegression` из `sklearn`.\n", + "\n", + "И давайте сравним полученные коэффициенты с теми, которые были сгенерированы вместе с данными." + ] + }, + { + "cell_type": "code", + "execution_count": 55, + "metadata": { + "colab": { + "base_uri": "https://localhost:8080/" + }, + "id": "iaxxRtstCPlD", + "outputId": "1837b72c-7dbd-4acc-dfd5-32b48d685a9d", + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Веса при признаках\n", + "True [59.32158596 58.74342238 44.07539836 25.03682142],\n", + "Trained [59.51242524 57.72548719 44.70646353 24.87225898]\n", + "\n", + "Вес свободный True 0, trained -1.6396678387172885\n" + ] + } + ], + "source": [ + "print('Веса при признаках')\n", + "print(f'True {coeffs},\\nTrained {next_weights[:-1]}')\n", + "\n", + "print('\\nВес свободный', end=' ')\n", + "print(f'True 0, trained {next_weights[-1]}')" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Метрики качества линейной регрессии\n", + "\n", + "В задачах машинного обучения мы хотим сравнивать несколько моделей машинного обучения и выбирать наилучшую из них. Решение о том, какая модель хорошая, а какая плохая, принимается на основе одной или нескольких *метрик* моделей машинного обучения.\n", + "\n", + "Без метрик обучение моделей вообще теряет всякий смысл – как же определить, какая из зоопарка обученных моделек хорошая, а какая плохая? Давайте разберёмся, как определить лучшую модель с помощью математики" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Интуиция за метриками стоит очень простая – давайте как-нибудь усредним отклонения по всем точкам и получим одно число – метрику качества линейной регрессии, т.е. насколько модель отклоняется от реальных данных." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Метрики принимают на вход два вектора, предсказания модели и истинные значения, после чего вычисляют по этим векторам качество модели.\n", + "\n", + "Сначала загрузим данные эксперимента" + ] + }, + { + "cell_type": "code", + "execution_count": 56, + "metadata": {}, + "outputs": [], + "source": [ + "from sklearn.datasets import make_regression\n", + "from sklearn.linear_model import LinearRegression\n", + "\n", + "features, y = make_regression()\n", + "\n", + "\n", + "reg = LinearRegression().fit(features, y)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Теперь получим два вектора – предказанное значение $\\hat{y}$ и истинное значение $y$:" + ] + }, + { + "cell_type": "code", + "execution_count": 57, + "metadata": {}, + "outputs": [], + "source": [ + "y_pred = reg.predict(features) # предсказанное значение\n", + "y_true = y # истинное значение" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Теперь посмотрим, какие функции можно применять к этим двум наборам точек" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Mean absolute error\n", + "\n", + "Для оценки качества регрессии можно использовать среднюю абсолютную ошибку" + ] + }, + { + "cell_type": "code", + "execution_count": 58, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "MAE = 2.604094717639782e-13\n" + ] + } + ], + "source": [ + "from sklearn.metrics import mean_absolute_error\n", + "\n", + "print(\"MAE = %s\" % mean_absolute_error(\n", + " reg.predict(features), y)\n", + ")" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "*Mean Absolute Error* - это просто сумма отклонений истинных значений $y$ от предсказаний нашей модели:\n", + "\n", + "$$\n", + "\\text{absolute error} = |y_1 - \\hat{y}_1| + |y_2 - \\hat{y}_2| + \\ldots\n", + "$$\n", + "\n", + "А потом мы эту сумму делим на количество точек - получаем среднюю ошибку\n", + "\n", + "Метрика принимает только положительные значения! Чем ближе к нулю, тем лучше модель." + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### MSE\n", + "\n", + "Mean Squared Error (MSE) - это базовая метрика для определения качества линейной регрессии\n", + "\n", + "Для каждого предсказанного значения $\\hat{y}_i$ мы считаем квадрат отклонения от фактического значения и считаем среднее по полученным величинам" + ] + }, + { + "cell_type": "code", + "execution_count": 59, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "MSE = 1.0322079481242069e-25\n" + ] + } + ], + "source": [ + "from sklearn.metrics import mean_squared_error\n", + "\n", + "mse = mean_squared_error(y_true, y_pred)\n", + "\n", + "print('MSE = %s' % mse)" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "В целом логика та же, что в *MAE*, только усреднять мы будем квадраты ошибок \n", + "$$\n", + "\\text{absolute error} = (y_1 - \\hat{y}_1)^2 + (y_2 - \\hat{y}_2)^2 + \\ldots\n", + "$$\n", + "\n", + "Эта метрика тоже принимает только положительные значения! Чем ближе к нулю, тем лучше модель." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Эта ошибка визуально похожа на *MSE*, но на графике видно, что *MAE*(красная линия) почти всегда меньше по значению, чем MSE (синяя линия). Это значит, что *MSE* более \"пессимистична\" и сильнее штрафует за большие ошибки - т.е. MSE лучше применять, когда вы уверены что в выборке нет \"выборосов\" (англ. outliers) - значений, который очень сильно отличаются от остальных точек. В этом случае MSE может быть очень плохой, а на деле ситуация приемлема. Если выбросы есть, лучше применять MAE.\n", + "\n", + "![rmse_vs_mae](https://248006.selcdn.ru/public/Data-science-4/img/rmse_vs_mae.png)" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### $R^2$ (коэффициент детерминации)\n", + "\n", + "Название - *coefficient of determination*. Наилучшее возможное значение 1.0, чем меньше тем хуже. Если этот коэффициент близок к 1, то условная дисперсия модели (то есть разброс предсказаний модели $\\hat{y}$ относительно разброса самой целевой переменной $y$ ) достаточно мала - то есть модель неплохо описывает данные. Коэффициент может быть даже отрицательным - то это значит, что модель совсем уж плохая.\n", + "\n", + "Эта метрика хороша тем, что она *нормализована*, то есть не превышает единицу - удобно сравнивать разные модели. Например, метрика $MSE$ может принимать ничем не ограниченные значения больше нуля - это не всегда удобно." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "В библиотеке *sklearn* есть готовая реализация этой метрики." + ] + }, + { + "cell_type": "code", + "execution_count": 60, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "r2_score = 1.0\n" + ] + } + ], + "source": [ + "from sklearn.metrics import r2_score\n", + "\n", + "print(\"r2_score = %s\" % r2_score(y_true, y_pred))" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Про другие ошибки можно почитать в [официальной документации](https://scikit-learn.org/stable/modules/model_evaluation.html#regression-metrics) в разделе про метрики регрессии." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Логистическая регрессия\n", + "\n", + "`Логистическая регрессия = sigmoid(linear_regression) = вероятности предсказания по классам`" + ] + }, + { + "cell_type": "code", + "execution_count": 61, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "(array([[-0.86305361],\n", + " [-1.4372011 ],\n", + " [ 0.19592225],\n", + " [-0.87164985],\n", + " [ 0.00982831],\n", + " [ 1.30282593],\n", + " [ 0.16134434],\n", + " [-0.9223264 ],\n", + " [-0.10173176],\n", + " [ 0.41006497],\n", + " [ 0.27129997],\n", + " [-0.71111212],\n", + " [-2.98259876],\n", + " [-0.09300387],\n", + " [ 0.82285659],\n", + " [ 0.16493473],\n", + " [-0.40806382],\n", + " [ 0.62136283],\n", + " [ 0.76258897],\n", + " [-0.11001122],\n", + " [-1.26261842],\n", + " [ 0.04513441],\n", + " [ 0.50026937],\n", + " [-0.6784482 ],\n", + " [ 0.2182344 ]]),\n", + " array([0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0, 1, 1, 1, 0, 1,\n", + " 1, 0, 1]))" + ] + }, + "execution_count": 61, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from sklearn.datasets import make_classification\n", + "from sklearn.linear_model import LinearRegression\n", + "\n", + "X, y = make_classification(n_samples=25, n_features=1, n_informative=1,\n", + " n_redundant=0, random_state=11, n_clusters_per_class=1,\n", + " class_sep=0.4)\n", + "\n", + "X, y" + ] + }, + { + "cell_type": "code", + "execution_count": 62, + "metadata": {}, + "outputs": [], + "source": [ + "model_lr = LinearRegression().fit(X, y)" + ] + }, + { + "cell_type": "code", + "execution_count": 63, + "metadata": {}, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "def sigmoid(x):\n", + " return 1 / (1 + np.exp(-x))\n", + "\n", + "x = np.linspace(-3, 3, num=100)\n", + "model_lr_a, model_lr_b = model_lr.coef_, model_lr.intercept_\n", + "model_lr_y = model_lr_a * x + model_lr_b\n", + "\n", + "plt.figure(figsize=(10, 2))\n", + "plt.plot(x, sigmoid(model_lr_y), linewidth=2, label='sklearn')\n", + "plt.scatter(X, y, c=y, s=100, edgecolors='black')\n", + "plt.ylabel('pred');plt.xlabel('x')\n", + "plt.yticks(np.arange(0, 2), ['0 class', '1 class'])\n", + "plt.ylim(-0.1, 1.1);plt.xlim(-3.5, 2)\n", + "plt.title('LogisticRegression')\n", + "plt.legend();" + ] + }, + { + "cell_type": "code", + "execution_count": 64, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "(array([[5.1, 3.5, 1.4, 0.2],\n", + " [4.9, 3. , 1.4, 0.2],\n", + " [4.7, 3.2, 1.3, 0.2],\n", + " [4.6, 3.1, 1.5, 0.2],\n", + " [5. , 3.6, 1.4, 0.2],\n", + " [5.4, 3.9, 1.7, 0.4],\n", + " [4.6, 3.4, 1.4, 0.3],\n", + " [5. , 3.4, 1.5, 0.2],\n", + " [4.4, 2.9, 1.4, 0.2],\n", + " [4.9, 3.1, 1.5, 0.1],\n", + " [5.4, 3.7, 1.5, 0.2],\n", + " [4.8, 3.4, 1.6, 0.2],\n", + " [4.8, 3. , 1.4, 0.1],\n", + " [4.3, 3. , 1.1, 0.1],\n", + " [5.8, 4. , 1.2, 0.2],\n", + " [5.7, 4.4, 1.5, 0.4],\n", + " [5.4, 3.9, 1.3, 0.4],\n", + " [5.1, 3.5, 1.4, 0.3],\n", + " [5.7, 3.8, 1.7, 0.3],\n", + " [5.1, 3.8, 1.5, 0.3],\n", + " [5.4, 3.4, 1.7, 0.2],\n", + " [5.1, 3.7, 1.5, 0.4],\n", + " [4.6, 3.6, 1. , 0.2],\n", + " [5.1, 3.3, 1.7, 0.5],\n", + " [4.8, 3.4, 1.9, 0.2],\n", + " [5. , 3. , 1.6, 0.2],\n", + " [5. , 3.4, 1.6, 0.4],\n", + " [5.2, 3.5, 1.5, 0.2],\n", + " [5.2, 3.4, 1.4, 0.2],\n", + " [4.7, 3.2, 1.6, 0.2],\n", + " [4.8, 3.1, 1.6, 0.2],\n", + " [5.4, 3.4, 1.5, 0.4],\n", + " [5.2, 4.1, 1.5, 0.1],\n", + " [5.5, 4.2, 1.4, 0.2],\n", + " [4.9, 3.1, 1.5, 0.2],\n", + " [5. , 3.2, 1.2, 0.2],\n", + " [5.5, 3.5, 1.3, 0.2],\n", + " [4.9, 3.6, 1.4, 0.1],\n", + " [4.4, 3. , 1.3, 0.2],\n", + " [5.1, 3.4, 1.5, 0.2],\n", + " [5. , 3.5, 1.3, 0.3],\n", + " [4.5, 2.3, 1.3, 0.3],\n", + " [4.4, 3.2, 1.3, 0.2],\n", + " [5. , 3.5, 1.6, 0.6],\n", + " [5.1, 3.8, 1.9, 0.4],\n", + " [4.8, 3. , 1.4, 0.3],\n", + " [5.1, 3.8, 1.6, 0.2],\n", + " [4.6, 3.2, 1.4, 0.2],\n", + " [5.3, 3.7, 1.5, 0.2],\n", + " [5. , 3.3, 1.4, 0.2],\n", + " [7. , 3.2, 4.7, 1.4],\n", + " [6.4, 3.2, 4.5, 1.5],\n", + " [6.9, 3.1, 4.9, 1.5],\n", + " [5.5, 2.3, 4. , 1.3],\n", + " [6.5, 2.8, 4.6, 1.5],\n", + " [5.7, 2.8, 4.5, 1.3],\n", + " [6.3, 3.3, 4.7, 1.6],\n", + " [4.9, 2.4, 3.3, 1. ],\n", + " [6.6, 2.9, 4.6, 1.3],\n", + " [5.2, 2.7, 3.9, 1.4],\n", + " [5. , 2. , 3.5, 1. ],\n", + " [5.9, 3. , 4.2, 1.5],\n", + " [6. , 2.2, 4. , 1. ],\n", + " [6.1, 2.9, 4.7, 1.4],\n", + " [5.6, 2.9, 3.6, 1.3],\n", + " [6.7, 3.1, 4.4, 1.4],\n", + " [5.6, 3. , 4.5, 1.5],\n", + " [5.8, 2.7, 4.1, 1. ],\n", + " [6.2, 2.2, 4.5, 1.5],\n", + " [5.6, 2.5, 3.9, 1.1],\n", + " [5.9, 3.2, 4.8, 1.8],\n", + " [6.1, 2.8, 4. , 1.3],\n", + " [6.3, 2.5, 4.9, 1.5],\n", + " [6.1, 2.8, 4.7, 1.2],\n", + " [6.4, 2.9, 4.3, 1.3],\n", + " [6.6, 3. , 4.4, 1.4],\n", + " [6.8, 2.8, 4.8, 1.4],\n", + " [6.7, 3. , 5. , 1.7],\n", + " [6. , 2.9, 4.5, 1.5],\n", + " [5.7, 2.6, 3.5, 1. ],\n", + " [5.5, 2.4, 3.8, 1.1],\n", + " [5.5, 2.4, 3.7, 1. ],\n", + " [5.8, 2.7, 3.9, 1.2],\n", + " [6. , 2.7, 5.1, 1.6],\n", + " [5.4, 3. , 4.5, 1.5],\n", + " [6. , 3.4, 4.5, 1.6],\n", + " [6.7, 3.1, 4.7, 1.5],\n", + " [6.3, 2.3, 4.4, 1.3],\n", + " [5.6, 3. , 4.1, 1.3],\n", + " [5.5, 2.5, 4. , 1.3],\n", + " [5.5, 2.6, 4.4, 1.2],\n", + " [6.1, 3. , 4.6, 1.4],\n", + " [5.8, 2.6, 4. , 1.2],\n", + " [5. , 2.3, 3.3, 1. ],\n", + " [5.6, 2.7, 4.2, 1.3],\n", + " [5.7, 3. , 4.2, 1.2],\n", + " [5.7, 2.9, 4.2, 1.3],\n", + " [6.2, 2.9, 4.3, 1.3],\n", + " [5.1, 2.5, 3. , 1.1],\n", + " [5.7, 2.8, 4.1, 1.3],\n", + " [6.3, 3.3, 6. , 2.5],\n", + " [5.8, 2.7, 5.1, 1.9],\n", + " [7.1, 3. , 5.9, 2.1],\n", + " [6.3, 2.9, 5.6, 1.8],\n", + " [6.5, 3. , 5.8, 2.2],\n", + " [7.6, 3. , 6.6, 2.1],\n", + " [4.9, 2.5, 4.5, 1.7],\n", + " [7.3, 2.9, 6.3, 1.8],\n", + " [6.7, 2.5, 5.8, 1.8],\n", + " [7.2, 3.6, 6.1, 2.5],\n", + " [6.5, 3.2, 5.1, 2. ],\n", + " [6.4, 2.7, 5.3, 1.9],\n", + " [6.8, 3. , 5.5, 2.1],\n", + " [5.7, 2.5, 5. , 2. ],\n", + " [5.8, 2.8, 5.1, 2.4],\n", + " [6.4, 3.2, 5.3, 2.3],\n", + " [6.5, 3. , 5.5, 1.8],\n", + " [7.7, 3.8, 6.7, 2.2],\n", + " [7.7, 2.6, 6.9, 2.3],\n", + " [6. , 2.2, 5. , 1.5],\n", + " [6.9, 3.2, 5.7, 2.3],\n", + " [5.6, 2.8, 4.9, 2. ],\n", + " [7.7, 2.8, 6.7, 2. ],\n", + " [6.3, 2.7, 4.9, 1.8],\n", + " [6.7, 3.3, 5.7, 2.1],\n", + " [7.2, 3.2, 6. , 1.8],\n", + " [6.2, 2.8, 4.8, 1.8],\n", + " [6.1, 3. , 4.9, 1.8],\n", + " [6.4, 2.8, 5.6, 2.1],\n", + " [7.2, 3. , 5.8, 1.6],\n", + " [7.4, 2.8, 6.1, 1.9],\n", + " [7.9, 3.8, 6.4, 2. ],\n", + " [6.4, 2.8, 5.6, 2.2],\n", + " [6.3, 2.8, 5.1, 1.5],\n", + " [6.1, 2.6, 5.6, 1.4],\n", + " [7.7, 3. , 6.1, 2.3],\n", + " [6.3, 3.4, 5.6, 2.4],\n", + " [6.4, 3.1, 5.5, 1.8],\n", + " [6. , 3. , 4.8, 1.8],\n", + " [6.9, 3.1, 5.4, 2.1],\n", + " [6.7, 3.1, 5.6, 2.4],\n", + " [6.9, 3.1, 5.1, 2.3],\n", + " [5.8, 2.7, 5.1, 1.9],\n", + " [6.8, 3.2, 5.9, 2.3],\n", + " [6.7, 3.3, 5.7, 2.5],\n", + " [6.7, 3. , 5.2, 2.3],\n", + " [6.3, 2.5, 5. , 1.9],\n", + " [6.5, 3. , 5.2, 2. ],\n", + " [6.2, 3.4, 5.4, 2.3],\n", + " [5.9, 3. , 5.1, 1.8]]),\n", + " array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,\n", + " 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,\n", + " 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,\n", + " 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,\n", + " 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,\n", + " 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,\n", + " 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2]))" + ] + }, + "execution_count": 64, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from sklearn.datasets import load_iris\n", + "from sklearn.linear_model import LogisticRegression\n", + "X, y = load_iris(return_X_y=True)\n", + "X, y" + ] + }, + { + "cell_type": "code", + "execution_count": 65, + "metadata": {}, + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "/Users/pakorolev/miniconda3/envs/py38/lib/python3.8/site-packages/sklearn/linear_model/_logistic.py:458: ConvergenceWarning: lbfgs failed to converge (status=1):\n", + "STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.\n", + "\n", + "Increase the number of iterations (max_iter) or scale the data as shown in:\n", + " https://scikit-learn.org/stable/modules/preprocessing.html\n", + "Please also refer to the documentation for alternative solver options:\n", + " https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression\n", + " n_iter_i = _check_optimize_result(\n" + ] + }, + { + "data": { + "text/plain": [ + "array([0, 0])" + ] + }, + "execution_count": 65, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "model = LogisticRegression().fit(X, y)\n", + "model.predict(X[:2])\n", + "\n" + ] + }, + { + "cell_type": "code", + "execution_count": 66, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([[9.81813537e-01, 1.81864490e-02, 1.43884301e-08],\n", + " [9.71751811e-01, 2.82481591e-02, 3.00932288e-08]])" + ] + }, + "execution_count": 66, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "model.predict_proba(X[:2, :])\n" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Метрики задачи классификации" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "\n", + "\n", + "После отбра признаков, выбора и, конечно, реализации модели и получения некоего результата в виде класса или вероятности принадлежности к классу, следующим шагом будет выяснение того, насколько эффективна модель." + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "#### Матрица ошибок (Confusion Matrix)\n", + "\n", + "Матрица ошибок - одна из интуитивно понятных метрик, используемых для определения точности модели. Она используется для задачи классификации, где выходные данные могут быть двух или более классов. " + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Возьмем два примера с, абстрактно, двумя классами - \"плохой\" и \"хороший\" - и подумаем, что в каждом конкретном случае для нас будет важнее предсказать.\n", + "\n", + "1. Предположим, что мы решаем задачу классификации, где предсказываем, болен человек или нет: *1*, если болен, и *0*, если здоров. Скажем, из 100 человек только 5 больны. Так как больных всего 5% от общего числа людей, то даже очень плохая модель (прогнозирование всех как здоровых) даст нам точность в 95% - это частая проблема для данных с несбалансированными классами. Поэтому в этом случае мы хотим правильно классифицировать всех больных людей - если здоровые будут отнесены к больным, то в данном случае это повлечет за собой явно меньше неприятностей.\n", + "\n", + "2. Теперь давайте представим, что нам надо классифицировать, является ли электронное письмо спамом или нет. Присвоим метку *1*, если это спам, и *0*, если не является спамом. Предположим, что модель классифицировала важное письмо, которого вы отчаянно ждете, как *спам*. В этой ситуации это может быть довольно трагично, ведь в письме может находиться важная информация. Соответственно, в задаче классификации электронных писем более важно минимизировать количество объектов, отнесенных к классу \"плохой\".\n", + "\n", + "Оба этих случая могут быть исследованы с помощью матрицы ошибок, элементы которой как раз таки указывают на ошибочную классификацию в первом и во втором примере. " + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Матрица ошибок представляет собой таблицу с двумя измерениями - {\"Actual\", \"Predicted\"}, каждое из которых представлено множеством прогнозируемых классов. Фактические результаты - это столбцы, а прогнозируемые - строки.\n", + "\n", + "![](https://248006.selcdn.ru/public/DS_Block2_M6_final/conf_mtrx.png)\n", + "\n", + "Сама по себе матрица ошибок не является показателем производительности как таковым, однако почти все метрики (Recall, Precision, Accuracy, AUC-ROC Curve) основаны на значениях внутри нее." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Теперь давайте разберемся в терминах матрицы ошибок: что означают все ее атрибуты TP, TN, FP и FN?\n", + "\n", + "![](https://248006.selcdn.ru/public/DS_Block2_M6_final/terms.png)\n", + "\n", + "Итак,\n", + "- *True Positives (TP)*: Фактический класс объекта был *1 (True)* и прогнозируемый также *1 (True)*\n", + "- *True Negatives (TN)*: Фактический класс объекта был *0 (False)* и прогнозируемый также *0 (False)*\n", + "- *False Positives (FP)*: Фактический класс объекта был *0 (False)*, а прогнозируемый - *1 (True)*. False - потому что модель предсказала неверно, positives - потому что предсказанный класс был положительным\n", + "- *False Negatives (FN)*: Фактический класс объекта был *1 (True)*, а прогнозируемый - *0 (False)*. False - потому что модель предсказала неверно, negatives - потому что предсказанный класс был отрицательным\n", + "\n", + "Логично, что идеальным сценарием является получение такой матрицы, в которой модель дает FP == 0 и FN == 0, однако в реальной жизни любая модель в большинстве случаев не будет давать 100% точности." + ] + }, + { + "cell_type": "code", + "execution_count": 67, + "metadata": {}, + "outputs": [], + "source": [ + "from sklearn.datasets import make_classification, load_iris\n", + "from sklearn.model_selection import train_test_split\n", + "from sklearn.linear_model import LogisticRegression\n", + "from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay\n", + "\n", + "\n", + "X, y = make_classification(n_samples=1800, n_features=2, n_informative=1,\n", + " n_redundant=0, random_state=11, n_clusters_per_class=1,\n", + " class_sep=0.4)\n", + "\n", + "\n", + "X_train, X_test, y_train, y_test = train_test_split(\n", + " X, y, test_size=0.2, random_state=42)\n", + "\n", + "model = LogisticRegression().fit(X_train, y_train)" + ] + }, + { + "cell_type": "code", + "execution_count": 68, + "metadata": {}, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "cm = confusion_matrix(y_test, model.predict(X_test))\n", + "\n", + "disp = ConfusionMatrixDisplay(confusion_matrix=cm,\n", + " display_labels=model.classes_)\n", + "disp.plot()\n", + "\n", + "plt.show()" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Мы знаем, что будет какая-то ошибка в предсказаниях модели и что это будет либо FP, либо FN, но что именно следует минимизировать, зависит исключительно от потребностей бизнеса и контекста проблемы, которую требуется решить. Например, в нашем примере с классификацией больных людей более важно минимизировать FN - нам важнее правильно распознать больных людей, чем ошибочно отнести здоровых к больным. Напротив, в примере со спамом менее важно пропустить надоедливую рекламу, чем важное письмо - здесь нам актуальнее минимизировать FP." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Теперь рассмотрим метрики классификации, основанные на терминах матрицы ошибок." + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "#### Accuracy (доля правильных ответов)\n", + "\n", + "Теперь давайте разберемся с метриками классификации, основанными на матрице ошибок.\n", + "\n", + "Наиболее очевидной мерой качества модели классификации является доля правильных ответов (иногда *accuracy* переводят как *точность*, но этот термин отведен для другой метрики - *precision*) - эту меру мы встречали в предыдущих уроках по классификации, и означает она не что иное, как отношение числа верных прогнозов к общему количеству прогнозов:\n", + "\n", + "\n", + "\n", + "![](https://248006.selcdn.ru/public/DS_Block2_M6_final/accuracy.png)\n", + "\n", + "В терминах матрицы ошибок accuracy приобретает вид:\n", + "\n", + "$$\n", + "Accuracy = \\frac{TP + TN}{TP + FP + FN + TN}\n", + "$$" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Доля правильных ответов является хорошей мерой, когда классы сбалансированы или почти сбалансированы - их соотношение в конечной выборке должно быть примерно одинаковым. Например, как в датасете Iris - там данные идеально сбалансированы, поэтому метрика дает точный ответ.\n", + "\n", + "Эта метрика совершенно не подходит в качестве меры, если один из классов явно преобладает над другим. Допустим, мы хотим оценить работу спам-фильтра почты. У нас есть 100 не-спам писем, 90 из которых наш классификатор определил верно (True Negative = 90, False Positive = 10), и 10 спам-писем, 5 из которых классификатор также определил верно (True Positive = 5, False Negative = 5).\n", + "\n", + "Тогда accuracy:\n", + "\n", + "$$\n", + "Accuracy = \\frac{5 + 90}{5 + 90 + 10 + 5} = 86,4\n", + "$$\n", + "\n", + "Однако если мы просто будем предсказывать все письма как не-спам, то получим более высокую accuracy:\n", + "\n", + "$$\n", + "Accuracy = \\frac{0 + 100}{0 + 100 + 0 + 10} = 90,9\n", + "$$\n" + ] + }, + { + "cell_type": "code", + "execution_count": 69, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.8472222222222222" + ] + }, + "execution_count": 69, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from sklearn.metrics import accuracy_score\n", + "\n", + "accuracy_score(y_test, model.predict(X_test))" + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "#### Precision, recall\n", + "\n", + "Для оценки качества работы алгоритма на каждом из классов по отдельности введем метрики precision (точность) и recall (полнота).\n", + "\n", + "\n", + "\n", + "$$\n", + "Precision = \\frac{TP}{TP + FP}\n", + "$$\n", + "\n", + "\n", + "$$\n", + "Recall = \\frac{TP}{TP + FN}\n", + "$$\n", + "\n", + "`Precision` можно интерпретировать как долю объектов, названных классификатором положительными и при этом действительно являющимися положительными, \n", + "\n", + "а `Recall` показывает, какую долю объектов положительного класса из всех объектов положительного класса нашел алгоритм." + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Precision и recall не зависят, в отличие от accuracy, от соотношения классов и потому применимы в условиях несбалансированных выборок." + ] + }, + { + "cell_type": "code", + "execution_count": 70, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.7888888888888889" + ] + }, + "execution_count": 70, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from sklearn.metrics import recall_score\n", + "\n", + "recall_score(y_test, model.predict(X_test))" + ] + }, + { + "cell_type": "code", + "execution_count": 71, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "0.8930817610062893" + ] + }, + "execution_count": 71, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from sklearn.metrics import precision_score\n", + "\n", + "precision_score(y_test, model.predict(X_test))" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "### Когда стоит использовать *точность*, а когда *полноту*?" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Если мы хотим сосредоточиться на минимизации ложных позитивов (вспомним пример со спамом, где нам накладнее пропустить одно важное письмо, чем получить несколько писем со спамом), мы применяем *точность*, а если нам более важно минимизировать риск пропустить хоть один позитивный результат (а здесь подойдет пример с больными, где нам опаснее получить ложноотрицательный ответ и отнести больного к здоровым), то следует использовать *полноту*.\n", + "\n", + "Также следует отметить, что точность и полнота не зависят от соотношения размеров классов. Даже если объектов одного из классов на порядки больше, данные показатели будут корректно отражать качество работы алгоритма." + ] + }, + { + "attachments": {}, + "cell_type": "markdown", + "metadata": {}, + "source": [ + "## Лаба 3\n", + "\n", + "\n", + "Найти датасет ( можно посмотреть на [kaggle](https://www.kaggle.com/datasets), [PapersWithCode](https://paperswithcode.com/datasets) или [sklearn](https://scikit-learn.org/stable/datasets.html)), обучить на нем линейную или логистическую регрессию. Так же необходимо посчитать метрики у обученной модели.\n" + ] + } + ], + "metadata": { + "colab": { + "provenance": [], + "toc_visible": true + }, + "kernelspec": { + "display_name": "Python 3 (ipykernel)", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.8.16" + } + }, + "nbformat": 4, + "nbformat_minor": 4 +} diff --git a/ml_system_design/seminars/sem_4.ipynb b/ml_system_design/seminars/sem_4.ipynb new file mode 100644 index 0000000..750dc58 --- /dev/null +++ b/ml_system_design/seminars/sem_4.ipynb @@ -0,0 +1,2384 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "id": "45e744e4-abbb-4572-a696-53d83e53ac36", + "metadata": { + "tags": [] + }, + "source": [ + "# Семинар 4\n", + "## Дерево решений, композиции алгоритмов\n", + "\n" + ] + }, + { + "cell_type": "markdown", + "id": "94996e48-9d13-4d79-b912-1d03a98cb8c3", + "metadata": {}, + "source": [ + "## Дерево решений" + ] + }, + { + "cell_type": "markdown", + "id": "64918135-d4bf-47b2-98be-f2c3418a4a76", + "metadata": {}, + "source": [ + "### Классификация" + ] + }, + { + "cell_type": "markdown", + "id": "767f1de4-1278-4b0e-890c-eecc16eb2477", + "metadata": {}, + "source": [ + "Чтобы понять деревья принятия решений, давайте просто построим одно такое дерево и посмотрим, как оно вырабатывает прогнозы. \n", + "\n", + "Следующий код обучает классификатор `DecisionTreeClassifier` на наборе данных `iris`" + ] + }, + { + "cell_type": "code", + "execution_count": 1, + "id": "895555e9-deb5-4746-b09d-4bd12d845136", + "metadata": {}, + "outputs": [], + "source": [ + "from sklearn.datasets import load_iris\n", + "from sklearn.tree import DecisionTreeClassifier, plot_tree" + ] + }, + { + "cell_type": "code", + "execution_count": 2, + "id": "b9e0d816-b995-44b6-9093-02913f17dfcf", + "metadata": {}, + "outputs": [ + { + "data": { + "text/html": [ + "
DecisionTreeClassifier(max_depth=2)
In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.
" + ], + "text/plain": [ + "DecisionTreeClassifier(max_depth=2)" + ] + }, + "execution_count": 2, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "iris = load_iris()\n", + "X = iris.data[:, 2:] #длина и ширина лепестка \n", + "y = iris.target\n", + "tree_clf = DecisionTreeClassifier(max_depth=2)\n", + "tree_clf.fit(X, y)" + ] + }, + { + "cell_type": "markdown", + "id": "af429158-8a9f-4cdd-a2d0-38a8bde3f1f2", + "metadata": {}, + "source": [ + "Вы можете визуализировать обученное дерево принятия решений" + ] + }, + { + "cell_type": "code", + "execution_count": 5, + "id": "5451ccb8-91d9-4d1e-9531-39899d8ebb94", + "metadata": {}, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "plot_tree(tree_clf);" + ] + }, + { + "cell_type": "markdown", + "id": "d88c4816-ef84-4d4f-ab9c-12ab40215e87", + "metadata": {}, + "source": [ + "Атрибут `samples` узла подсчитывает, к скольким обучающим образцам он применяется. Например, `100` обучающих образцов имеют длину лепестка больше 2.45 см (глубина 1, справа), среди которых `54` образца имеют ширину лепестка меньше 1.75 см (глубина 2, слева). \n", + "\n", + "Атрибут `value` узла сообщает, к скольким обучающим образцам каждого класса применяется этот узел: например, правый нижний узел применяется к `О` образцов ириса щетинистого, `1` образцу ириса разноцветного и `45` образцам ириса виргинского. \n", + "\n", + "Атрибут `gini` (`показатель Джини (Gini)`) узла измеряет его загрязненность (`inpurity`): узел \"чист\" (`gini=O`), если все обучающие образцы, к которым он применяется, принадлежат одному и тому же классу. Скажем, поскольку узел на глубине 1 слева применяется только к обучающим образцам ириса щетинистого, он чистый и его показатель Джини равен `О`." + ] + }, + { + "cell_type": "markdown", + "id": "5b57fd4f-4de2-4e88-9050-bdfe00ca50da", + "metadata": {}, + "source": [ + "*Одним из многих качеств деревьев принятия решений является то, что они требуют совсем небольшой подготовки данных. В частности, для них вообще не нужно масштабирование признаков.*" + ] + }, + { + "cell_type": "markdown", + "id": "c76867e8-21ab-499d-812a-c64969c198cb", + "metadata": {}, + "source": [ + "Дерево принятия решений также в состоянии оценивать вероятность принадлежности образца определенному классу `k`: сначала происходит обход дерева, чтобы найти листовой узел для данного образца, и затем возвращается пропорция обучающих образцов класса `k` в найденном узле." + ] + }, + { + "cell_type": "code", + "execution_count": 6, + "id": "b9ad8671-d9c4-4c00-8a86-58a123e3e06e", + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([[0. , 0.02173913, 0.97826087]])" + ] + }, + "execution_count": 6, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "tree_clf.predict_proba([X[132]])" + ] + }, + { + "cell_type": "code", + "execution_count": 7, + "id": "eede6519-b26b-4e8e-b1f6-f1c8b45a1048", + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "array([2])" + ] + }, + "execution_count": 7, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "tree_clf.predict([X[132]])" + ] + }, + { + "cell_type": "markdown", + "id": "c7165ddd-a8a4-4c66-8fef-aba3241030be", + "metadata": {}, + "source": [ + "### Гиперпараметры реrуляризации" + ] + }, + { + "cell_type": "markdown", + "id": "f6982729-b85d-4693-aec3-e19a565088a1", + "metadata": {}, + "source": [ + "Деревья принятия решений выдвигают очень мало предположений об обучающих данных (в противоположность линейным моделям, которые очевидным образом предполагают, что данные линейны, к примеру).\n", + "\n", + "Так как нет никакх ограничений, дерево будет адаптировать себя к обучающим данным, очень близко подгоняясь к ним и, скорее всего, допуская переобучение.\n", + "\n", + "Во избежание переобучения обучающими данными вы должны ограничивать свободу дерева принятия решений во время обучения. Такой прием называется регуляризацией\n", + "\n", + "Гиперпараметры регуляризации зависят от используемого алгоритма, но обычно вы можете, по крайней мере, ограничить максимальную глубину дерева принятия решений. В `Scikit-Learn` максимальная глубина управляется гиперпараметром `max_depth`\n", + "\n", + "Класс `DecisionTreeClassifier` имеет несколько других параметров, которые похожим образом ограничивают форму дерева принятия решений: \n", + "- `min_samplеs_sрlit` (минимальное число образцов, которые должны присутствовать в узле, прежде чем его можно будет расщепить).\n", + "- `min_samples_leaf` (минимальное количество образцов, которое должен иметь листовой узел).\n", + "- `min_weight_fraction_leaf` (то же, что и `min_samplеs_lеаf`, но выраженное в виде доли от общего числа взвешенных образцов).\n", + "- `max_leaf_nodes` (максимальное количество листовых узлов).\n", + "- и `max_features` (максимальное число признаков, которые оцениваются при расщеплении каждого узла). \n", + "\n", + "Увеличение гиперпараметров `min_*` или уменьшение гиперпараметров `max_*` будет регуляризировать модель." + ] + }, + { + "cell_type": "code", + "execution_count": 8, + "id": "4b2e3de6-4ebd-4644-8b56-df2b7a1ff7e6", + "metadata": {}, + "outputs": [ + { + "data": { + "text/html": [ + "
DecisionTreeClassifier()
In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.
" + ], + "text/plain": [ + "DecisionTreeClassifier()" + ] + }, + "execution_count": 8, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "iris = load_iris()\n", + "X = iris.data[:, 2:] #длина и ширина лепестка \n", + "y = iris.target\n", + "tree_clf = DecisionTreeClassifier()\n", + "tree_clf.fit(X, y)" + ] + }, + { + "cell_type": "code", + "execution_count": 9, + "id": "91eb9c03-a51e-4d6a-9eb9-cbc8eb4db3f0", + "metadata": {}, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "plot_tree(tree_clf);" + ] + }, + { + "cell_type": "code", + "execution_count": 10, + "id": "76196f06-3718-42e5-bdcd-651ef7995a8d", + "metadata": {}, + "outputs": [ + { + "data": { + "text/html": [ + "
DecisionTreeClassifier(max_depth=2)
In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.
" + ], + "text/plain": [ + "DecisionTreeClassifier(max_depth=2)" + ] + }, + "execution_count": 10, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "tree_clf = DecisionTreeClassifier(max_depth=2)\n", + "tree_clf.fit(X, y)" + ] + }, + { + "cell_type": "code", + "execution_count": 11, + "id": "5d55685a-4bcb-4b08-b8d8-dfcf08327c23", + "metadata": {}, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "plot_tree(tree_clf);" + ] + }, + { + "cell_type": "markdown", + "id": "9d4fb6e8-ac23-4f03-b3d5-4601b90b8696", + "metadata": {}, + "source": [ + "### Регрессия\n", + "\n", + "Деревья принятия решений также способны иметь дело с задачами регрессии. Давайте построим дерево регрессии с применением класса `DecisionTreeRegressor` из `Scikit-Learn`, обучив его на зашумленномнаборе данных с `max_depth=2`:" + ] + }, + { + "cell_type": "code", + "execution_count": 12, + "id": "018ec935-f891-4d85-a0a0-dcce08c57726", + "metadata": {}, + "outputs": [ + { + "data": { + "text/html": [ + "
DecisionTreeRegressor(max_depth=2)
In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.
" + ], + "text/plain": [ + "DecisionTreeRegressor(max_depth=2)" + ] + }, + "execution_count": 12, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from sklearn.tree import DecisionTreeRegressor, plot_tree\n", + "from sklearn.datasets import make_regression\n", + "\n", + "X, y = make_regression(n_samples=150, n_features=2, noise=10)\n", + "\n", + "tree_reg = DecisionTreeRegressor(max_depth=2 )\n", + "tree_reg.fit(X, y)" + ] + }, + { + "cell_type": "code", + "execution_count": 13, + "id": "ad8891eb-037e-4ec0-bcdb-aec87c2a4f22", + "metadata": {}, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "plot_tree(tree_reg);" + ] + }, + { + "cell_type": "markdown", + "id": "b6d9ea82-92d2-463d-8a00-def5658832ea", + "metadata": {}, + "source": [ + "Это дерево выглядит очень похожим на дерево классификации, которое мы строили ранее.\n", + "Главное отличие в том, что вместо прогнозирования класса в каждом узле оно прогнозирует значение.\n", + "\n", + "Обратите внимание, что спрогнозированное значение для каждой области всегда будет средним целевым значением образцов в этой области. Алгоритм расщепляет каждую область так, чтобы расположить большинство обучающих образцов как можно ближе к спрогнозированному значению." + ] + }, + { + "cell_type": "code", + "execution_count": 14, + "id": "4a9cd783-9748-4b55-877a-e8d45b6ac079", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "12.938154389121735\n" + ] + } + ], + "source": [ + "from sklearn.tree import DecisionTreeRegressor, plot_tree\n", + "from sklearn.datasets import make_regression\n", + "from sklearn.model_selection import train_test_split\n", + "from sklearn.metrics import mean_absolute_error\n", + "\n", + "X, y = make_regression(n_samples=150, n_features=1, noise=10)\n", + "\n", + "X_train, X_test, y_train, y_test = train_test_split(\n", + " X,\n", + " y,\n", + " test_size=0.2,\n", + " random_state=42\n", + ")\n", + "\n", + "\n", + "tree_reg = DecisionTreeRegressor()\n", + "tree_reg.fit(X_train, y_train)\n", + "\n", + "y_pred = tree_reg.predict(X_test)\n", + "print(mean_absolute_error(y_test, y_pred))\n" + ] + }, + { + "cell_type": "code", + "execution_count": 15, + "id": "81e06757-4fe7-4f48-83a5-0c5b7bbe6ff5", + "metadata": {}, + "outputs": [ + { + "data": { + "image/png": "", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "plot_tree(tree_reg);" + ] + }, + { + "cell_type": "code", + "execution_count": 16, + "id": "dd645280-1bda-4c1d-95a5-9829f696ffd8", + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "" + ] + }, + "execution_count": 16, + "metadata": {}, + "output_type": "execute_result" + }, + { + "data": { + "image/png": "iVBORw0KGgoAAAANSUhEUgAAAioAAAGdCAYAAAA8F1jjAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjcuMSwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy/bCgiHAAAACXBIWXMAAA9hAAAPYQGoP6dpAAA+N0lEQVR4nO3df3yT5b3/8XdSaAujCSvQptWKhU1YrYiorcVfbIJ0+gXZ5pwogznEyRediJviztGuujNA3ea2w8GdbcIcOmVn/oCdc+rhh+gchTp+HKwVvsIqKrTgqCQF18Ka+/tHSCQ0aZM0d3IneT0fjzwwd667ue7Amveu63Ndt80wDEMAAAAWZE92BwAAAMIhqAAAAMsiqAAAAMsiqAAAAMsiqAAAAMsiqAAAAMsiqAAAAMsiqAAAAMvql+wO9JXX69WBAweUl5cnm82W7O4AAIAIGIah9vZ2FRcXy24PP26S8kHlwIEDKikpSXY3AABADN5//32deeaZYV9P+aCSl5cnyXehDocjyb0BAACR8Hg8KikpCXyPh5PyQcU/3eNwOAgqAACkmN7KNiimBQAAlkVQAQAAlkVQAQAAlhVzUHnttdc0ZcoUFRcXy2az6cUXXwx63TAMPfjggyoqKtKAAQM0ceJEvfPOO0Ft2tradPPNN8vhcGjw4MGaPXu2jh49GmuXAABAmok5qBw7dkznn3++li5dGvL1Rx55RD/72c/0xBNPaMuWLfrUpz6lyZMnq6OjI9Dm5ptv1ltvvaW1a9fqj3/8o1577TXddtttsXYJAACkGZthGEaff4jNphdeeEHTpk2T5BtNKS4u1j333KPvfOc7kiS3263CwkKtWLFCN954o95++22VlZXpjTfe0EUXXSRJqqur0zXXXKMPPvhAxcXFEb23x+OR0+mU2+1m1Q8AACki0u9vU2pUmpub1draqokTJwaOOZ1OVVZWqr6+XpJUX1+vwYMHB0KKJE2cOFF2u11btmwJ+7M7Ozvl8XiCHgAAID2ZElRaW1slSYWFhUHHCwsLA6+1traqoKAg6PV+/fopPz8/0CaURYsWyel0Bh7sSgsAQPpKuVU/999/v9xud+Dx/vvvJ7tLAAAkVJfXUP3ew3ppx37V7z2sLm+fqzgsy5SdaV0ulyTp4MGDKioqChw/ePCgxo4dG2hz6NChoPP+8Y9/qK2tLXB+KDk5OcrJyYl/pwEASAF1jS2qXdOkFvcni1OKnLmqmVKm6vKiHs5MTaaMqJSWlsrlcmn9+vWBYx6PR1u2bFFVVZUkqaqqSkeOHNHWrVsDbTZs2CCv16vKykozugUAQEqra2zR3JXbgkKKJLW6OzR35TbVNbYkqWfmiXlE5ejRo9qzZ0/geXNzs3bs2KH8/HydddZZmj9/vn7wgx/os5/9rEpLS/XAAw+ouLg4sDLoc5/7nKqrqzVnzhw98cQTOnHihO644w7deOONEa/4AQAgU3R5DdWuaVKoSR5Dkk1S7ZomTSpzKcve8/1zUknMQeUvf/mLPv/5zweeL1iwQJI0a9YsrVixQvfee6+OHTum2267TUeOHNFll12muro65ebmBs55+umndccdd+iqq66S3W7XV77yFf3sZz/rw+UAAJCeGprbuo2knMqQ1OLuUENzm6pGDklcx0wWl31Ukol9VAAAmeClHft117M7em330xvH6rqxZ/T5/bq8hhqa23SovUMFebmqKM2P60hNpN/fphTTAgCA+CrIy+29URTtemKlgt2UW54MAEAmqijNV5EzV+HGNGzyhYmK0vw+vY/VCnYJKgAApIAsu001U8okqVtY8T+vmVLWp+mZ3gp2JV/BbiL3bSGoAACQIqrLi7Rsxji5nMHTOy5nrpbNGNfnaZloCnYThRoVAABSSHV5kSaVuUwpdD3UHj6kxNIuHggqAACkmCy7zZQlyIks2I0UUz8AAEBS4gp2o0FQAQAAkhJTsBstggoAAAgwu2A3WtSoAACAIGYW7EaLoAIAALoxq2A3Wkz9AAAAyyKoAAAAyyKoAAAAyyKoAAAAyyKoAAAAy2LVDwAAGabLa1hi6XEkCCoAAGSQusYW1a5pCrpLcpEzVzVTyhK+mVskmPoBACBD1DW2aO7KbUEhRZJa3R2au3Kb6hpbktSz8AgqAABkgC6vodo1TTJCvOY/VrumSV3eUC2Sh6ACAEAGaGhu6zaScipDUou7Qw3NbYnrVAQIKgAAZIBD7eFDSiztEoWgAgBABijIy+29URTtEoVVPwAAnJRKy3ajVVGaryJnrlrdHSHrVGySXE7fNVsJQQUAAKXest1oZdltqplSprkrt8kmBYUVfxSrmVJmuWDG1A8AIOOl4rLdWFSXF2nZjHFyOYOnd1zOXC2bMc6SgYwRFQBARutt2a5NvmW7k8pclhttiEV1eZEmlblSZoqLoAIAyGjRLNutGjkkcR0zUZbdljLXwtQPACCjpeqy3UxBUAEAZLRUXbabKQgqAICM5l+2G65Cwybf6h+rLdvNFAQVAEBG8y/bldQtrFh52W6mIKgAADJeKi7bzRSs+gEAQKm3bDdTmDqicvbZZ8tms3V7zJs3T5I0YcKEbq/dfvvtZnYJAICw/Mt2rxt7hqpGDiGkWICpIypvvPGGurq6As8bGxs1adIkffWrXw0cmzNnjh566KHA84EDB5rZJQAAwvN2Sfs2SUcPSoMKpeHjJXtWsnuV0UwNKsOGDQt6vnjxYo0cOVJXXnll4NjAgQPlcrnM7AYAAL1rWi3V3Sd5DnxyzFEsVS+RyqYmr1+h9DVQRXK+RUJbwmpUjh8/rpUrV2rBggWy2T4ZSnv66ae1cuVKuVwuTZkyRQ888ECPoyqdnZ3q7OwMPPd4PKb2GwCQAZpWS6tmSqdvpO9p8R2/4SnrhJW+BqpIzrdQaLMZhhHq9gZxt2rVKt1000167733VFxcLEn693//dw0fPlzFxcXauXOn7rvvPlVUVOj5558P+3O+//3vq7a2tttxt9sth8NhWv8BAGnK2yU9Xh78pRzE5vuSnv9m8qeBwgUq/0Lq3gJVJOdLfXuPCHk8Hjmdzl6/vxMWVCZPnqzs7GytWbMmbJsNGzboqquu0p49ezRy5MiQbUKNqJSUlBBUAACxaf6T9Jv/03u7WX+USi83vz/h9DVQRXJ+XpEvjyQgtEUaVBKyj8q+ffu0bt063XrrrT22q6yslCTt2bMnbJucnBw5HI6gBwAAMTt6ML7tzLJvUw8BQpIMybPf1y7W89sP9O09TJCQoLJ8+XIVFBTo2muv7bHdjh07JElFRWysAwBIkEGF8W1nlr4GqngGrQSGNtOLab1er5YvX65Zs2apX79P3m7v3r165plndM0112jIkCHauXOn7r77bl1xxRUaM2aM2d0CAMBn+HjfdIanRd3rMqTAdMfw8YnuWbC+Bqp4Bq0EhjbTR1TWrVun9957T9/85jeDjmdnZ2vdunW6+uqrNXr0aN1zzz36yle+0mMNCwAAcWfP8q1mkRT2bj/Vi5NfSOsPVD3dPtFxRvhAFcn5ecV9ew8TJKyY1iyRFuMAANCjkEtyz/CFFCstTV418+STU7++o13108P5Ut/eI0KWW/VjFoIKACBuLLLJWY/6GqgiOT8BoY2gAgBAukqDnWkj/f7m7skAAKQae1bf9nSJ5Py+vkecJGR5MgAAQCwIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLL6JbsDAIAYebukfZukowelQYXS8PGSPSvZvQLiiqACAKmoabVUd5/kOfDJMUexVL1EKpuavH4BccbUDwCkmqbV0qqZwSFFkjwtvuNNq5PTL8AEBBUASCXeLt9IiowQL548VrfQ1w5IAwQVAEgl+zZ1H0kJYkie/b52QBqgRgUAUsnRg/FtlygU/iJGBBUASCWDCuPbLhEo/EUfMPUDAKlk+Hjfl7xsYRrYJMcZvnZWQOEv+oigAgCpxJ7lG4mQ1D2snHxevdga0yoU/iIOCCoAkGrKpko3PCU5ioKPO4p9x02YTunyGqrfe1gv7div+r2H1eUNFT5OQ+Ev4sDUGpXvf//7qq2tDTo2atQo7dq1S5LU0dGhe+65R88++6w6Ozs1efJk/du//ZsKCy00twoAVlQ2VRp9bUIKVOsaW1S7pkkt7o7AsSJnrmqmlKm6vCj8iala+AtLMX1E5dxzz1VLS0vg8frrrwdeu/vuu7VmzRr9/ve/16uvvqoDBw7oy1/+stldAoD0YM+SSi+Xzrve96dJIWXuym1BIUWSWt0dmrtym+oaW8KfnIqFv7Ac01f99OvXTy6Xq9txt9utX//613rmmWf0hS98QZK0fPlyfe5zn9PmzZt1ySWXmN01AEg7XV5DDc1tOtTeoYK8XFWU5ivLHq7wtvefVbumKWyFiU1S7ZomTSpzhX4Pf+Gvp0Wh61RsvtetUvgLSzI9qLzzzjsqLi5Wbm6uqqqqtGjRIp111lnaunWrTpw4oYkTJwbajh49WmeddZbq6+vDBpXOzk51dnYGnns8HrMvAQBSQsxTNGE0NLd1G0k5lSGpxd2hhuY2VY0c0r2Bv/B31Uz5Ys2pYcVihb+wLFOnfiorK7VixQrV1dVp2bJlam5u1uWXX6729na1trYqOztbgwcPDjqnsLBQra2tYX/mokWL5HQ6A4+SkhIzLwEALOvUAtefrvt/uj3WKZowDrWHDykRt0tC4S/Si6kjKl/84hcD/z1mzBhVVlZq+PDhWrVqlQYMGBDTz7z//vu1YMGCwHOPx0NYAZBxQo2ehBLRFE0YBXm58WmXwMJfpJ+ELk8ePHiwzjnnHO3Zs0cul0vHjx/XkSNHgtocPHgwZE2LX05OjhwOR9ADADJJuALXcE6doolGRWm+ipy5PW0tpyKnrw6mN12yq95bppe6qlTvLVMXu2MgQgn9l3L06FHt3btXRUVFuvDCC9W/f3+tX78+8Pru3bv13nvvqaqqKpHdAoCU0VOBa28incrxy7LbVDOlTFLYreVUM6Ws11GausYWXbZkg6b/crPuenaHpv9ysy5bsiGm6ShkHlODyne+8x29+uqrevfdd7Vp0yZ96UtfUlZWlqZPny6n06nZs2drwYIFeuWVV7R161bdcsstqqqqYsUPgJQX0wZpEeitwLUnkU7lnKq6vEjLZoyTyxl8rsuZq2UzxvVapNun5c2ATK5R+eCDDzR9+nQdPnxYw4YN02WXXabNmzdr2LBhkqSf/OQnstvt+spXvhK04RsApLJ4r745VbSjIpJv9MMV4RRNKNXlRZpU5op62XOflzcDkmyGYcQn5ieJx+OR0+mU2+2mXgVA0vlHEE7/xer/Go5kFKIn9XsPa/ovN0fcPl7vG4tI+/q7OZeEXt6MtBbp9zfVTAAQJ72NIEi+EYS+TAP1VuB6ukinaMwQl+XNyHimb/gGAJmizxukRcBf4Dp35bZwW6hp/sRzdPbQgX3embav4ra8GRmNoAIAcZKoEQR/gevpdTCuONXBxIt/9KfV3RFuA/0+1c4gMxBUACBOEjmCEGuBayJFMvoTyfJmZDZqVAAgTuK5QVoksuw2VY0couvGnqGqkUMs+YXf1+XNACMqABAnjCCElgqjP7AulicDQJyZuY8KkC4i/f5mRAUA4owRBCB+CCoAYAJ//QiAvqGYFgAAWBZBBQAAWBZTPwCA3nm7pH2bpKMHpUGF0vDxkj0r2b1CBiCoAAB61rRaqrtP8hz45JijWKpeIpVNTV6/kBGY+gEAhNe0Wlo1MzikSJKnxXe8aXVy+oWMQVABAITm7fKNpPR0P+i6hb52gEkIKgCQSN4uqflP0pv/4fvTyl/y+zZ1H0kJYkie/b52gEmoUQGAREm1Wo+jB+PbDogBIyoAkAipWOsxqDC+7YAYEFQAwGypWusxfLxvxKen+0E7zvC1A0xCUAEAs6VqrYc9yzctJal7WDn5vHox+6nAVAQVADBbIms94l2sWzZVuuEpyXHaXZ8dxb7jVqytQVqhmBYAzJaoWg+zinXLpkqjr2VnWiQFQQUAzOav9fC0KHSdis33el9qPfzFuqf/fH+xbl9HP+xZUunlsZ8PxIipHwAwm9m1HqlarAtEgKACAIlgZq1HqhbrAhFg6gcAEsWsWg82ZkMaI6gAQCKZUevBxmxIY0z9AECqY2M2pDGCCgCkOjZmQxojqABAOmBjNqQpalQAWF6X11BDc5sOtXeoIC9XFaX5yrKHm+bIYGzMhjREUAFgaXWNLapd06QWd0fgWJEzVzVTylRdXtTDmRmKjdmQZpj6AWBZdY0tmrtyW1BIkaRWd4fmrtymusaWJPUsdl1eQ/V7D+ulHftVv/ewuryhNmkD4GdqUFm0aJEuvvhi5eXlqaCgQNOmTdPu3buD2kyYMEE2my3ocfvtt5vZLQApoMtrqHZNU097rap2TVNKfdHXNbbosiUbNP2Xm3XXszs0/ZebddmSDSkZuIBEMTWovPrqq5o3b542b96stWvX6sSJE7r66qt17NixoHZz5sxRS0tL4PHII4+Y2S0AKaChua3bSMqpDEkt7g41NLclrlN9kI6jQ0AimFqjUldXF/R8xYoVKigo0NatW3XFFVcEjg8cOFAul8vMrgBIMYfaw4eUWNolU2+jQzb5RocmlbkoEgZOk9AaFbfbLUnKz88POv70009r6NChKi8v1/3336+PP/44kd0CYEEFeblxbZdM6TY6BCRSwlb9eL1ezZ8/X5deeqnKy8sDx2+66SYNHz5cxcXF2rlzp+677z7t3r1bzz//fMif09nZqc7OzsBzj8djet8BJF5Fab6KnLlqdXeEHImwSXI5fUuVrS6dRoeAREtYUJk3b54aGxv1+uuvBx2/7bbbAv993nnnqaioSFdddZX27t2rkSNHdvs5ixYtUm1tren9BZBcWXabaqaUae7KbbJJQWHFPzlSM6UsJaZK0ml0CEi0hEz93HHHHfrjH/+oV155RWeeeWaPbSsrKyVJe/bsCfn6/fffL7fbHXi8//77ce8vAGuoLi/Sshnj5HIGf4G7nLlaNmNcyuyj4h8d6uFOPCpKkdEhINFMHVExDEN33nmnXnjhBW3cuFGlpaW9nrNjxw5JUlFR6F9AOTk5ysnJiWc3AVhYdXmRJpW5Unpn2nQaHQISzdSgMm/ePD3zzDN66aWXlJeXp9bWVkmS0+nUgAEDtHfvXj3zzDO65pprNGTIEO3cuVN33323rrjiCo0ZM8bMrgFIIVnyqsreJNlbpEMfSseGSXlFKbU9vH906PRddl3ssgv0yGYYhmm7Jdlsof/fwfLly/WNb3xD77//vmbMmKHGxkYdO3ZMJSUl+tKXvqR//ud/lsPhiOg9PB6PnE6n3G53xOcASCFNq6W6+yTPge6vOYp9dw1OxA33vF1xuYcO9y0CfCL9/jY1qCQCQQVIY02rpVUzpZDrfvxs0d8dONrQESosJTIkAWko0u9vbkoIwJq8Xb5w0GNIOaluoe+uwZGMcEQbOsKFJU+L73i0IQlAVLgpIQBr2rcp9HRPN4bk2e9r3xt/6Dj95/pDR9Pq4OM9hqWTx+oW+toBMAVBBYA1HT0Y3/axhI5ew1IUIQlATAgqAKxpUGF828cSOiINS9GGKgARI6gAsKbh4yVHca8VKl5DatUQdZVU9dwwltARaViKNlQBiBhBBYA12bN8Ba6yyRsmrfjXLNYc/7oa9rl7/nmxhI6TYUk97SnrOMPXDoApCCoArKtsqt6oeFytCr21fIuGaO6J+XrZW9H7Df1iCR2BsCQZp50XeF69OGU2nQNSEcuTAVha16gpuuy1Iaqw71Kh2jTE5tFhw6GDyleDd7S8J///Vq839POHjlUzpXAb2YcKHWVTtb3qpyqur1WhDgcOH1S+WqpqdAFLkwFTEVQAWFpFab4KnQO1xV0Wsl7FJt829BHd0K9sqm/fk5D7qCwOuR9KXWOL5r4yVDb9VBX2XSrQER3SYL3hHS3vK3YtO6OF7e8BE7EzLQDLq2ts0dyV2ySFvqFf1HdSjnBn2i6vocuWbAi6N8+p/CHp9fu+wDb4QJQi/f6mRgWA5flv6OdyBk/vuJy50YcUyRdKSi+Xzrve92eYGpOG5rawIUXyhaYWd4camtuie38AEWPqB0BKqC4v0qQyV0Jv6NdrgW6U7QBEj6ACoM8SdUfgLLtNVSOHxP3nhtNrgW6U7QBEj6ACoE/qGltUu6YpaIqkyJmrmillKV9kWlGaryJnrlrdHX0v5AUQE2pUAMTMX+R6eh1Hq7tDc1duU11jS5J6Fh9ZdptqppRJ6r77iv95zZQyCmkBExFUAMSky2uodk1TT7f4U+2aJnWF21Y2RcS9kBdAVJj6ARCTaFbEJLKuxAzJKOQF4ENQARCTTFsRk+hCXgA+TP0AiAkrYgAkAkEFQEz8K2J6uMWfilgRA6CPCCoAYsKKGACJQFABEDNWxAAwG8W0APqEFTEAzERQAdBnrIgJIcI7NAPoGUEFAOKtabVUd5/kOfDJMUexVL1EKpuavH4BKYgaFQCIp6bV0qqZwSFFkjwtvuNNq5PTLyBFEVSANNXlNVS/97Be2rFf9XsPp/xW9inB2+UbSenpxgJ1C33tAESEqR8gDaXzHY0tbd+m7iMpQQzJs9/XrvTyhHULSGWMqABppk93NPZ2Sc1/kt78D9+f/D//6Bw9GN92ABhRAdJJb3c0tsl3R+NJZa7uy4cpAO27QYXxbQeAERUgnURzR+MgFIDGx/DxvnDX040FHGf42gGICEEFSCMx3dGYAtD4sWf5RqAkhb2xQPVi9lMBokBQAdJITHc0jqYAFL0rmyrd8JTkOK1o2VHsO840GhAValSANOK/o3GruyPk+IhNvvvwBN3RmALQ+CubKo2+lp1pgTiwxIjK0qVLdfbZZys3N1eVlZVqaGhIdpeAlBTTHY0pADWHPcu3BPm8631/ElKAmCQ9qDz33HNasGCBampqtG3bNp1//vmaPHmyDh06lOyuASkp6jsaUwAKwMJshmEkdbvKyspKXXzxxfrXf/1XSZLX61VJSYnuvPNOLVy4sNfzPR6PnE6n3G63HA6H2d0FUkaX14j8jsb+VT+SgotqbTIk/b8rl2rXpydwZ2QAcRPp93dSa1SOHz+urVu36v777w8cs9vtmjhxourr65PYMyD1RXVHY38B6Gn7qPx9QKFqT8zUsy8PlrRDEjvcAkispAaVv/3tb+rq6lJhYfDcd2FhoXbt2hXynM7OTnV2dgaeezweU/sIZIzTCkAbPuyn6f+Tpa7TZoj9O9yGnEYCgDhLeo1KtBYtWiSn0xl4lJSUJLtLQMKZdsPBkwWgXed+RXdtyesWUqRPJoZq1zRxo0MApkvqiMrQoUOVlZWlgweDlz0ePHhQLpcr5Dn333+/FixYEHju8XgIK8goibjhYDQ73EY8vQQAMUjqiEp2drYuvPBCrV+/PnDM6/Vq/fr1qqqqCnlOTk6OHA5H0APIFH264WAUYtrhFgBMkPQN3xYsWKBZs2bpoosuUkVFhR5//HEdO3ZMt9xyS7K7BlhKn244GKWYdrhNIVGtiAKQVEkPKl/72tf04Ycf6sEHH1Rra6vGjh2rurq6bgW2QKZL5HRMTDvcpohETJ0BiB9LFNPecccd2rdvnzo7O7VlyxZVVlYmu0uA5SRyOiamHW5TQKKmzgDEjyWCCoDeJXo6Juodbi2ut6kziZVMgBUlfeoHQGSSMR1TXV6kSWWutKjnYCUTkJoIKkCK8E/HzF25TTadvtG9T9B0jLcrLnfvjWqHWwtjJROQmggqQArxT8ecXgzqOr0YtGl1t+3w5SiWqpf4dqDNQOm+kglIVwQVIMX0Oh0TuMHgaRNEnhbf8RueChtW0nnZbjqvZALSGUEFSEFhp2O8Xb6RlJ52W6lb6Lunz2nTQOm+bDfqqTMAlsCqHyCd7NsUPN3TjSF59vvanaKnZbvzVv5FDRtelN78D6n5T74wlKLSbSUTkAkYUQHSydGDvbc5rV1Py3avtjeopv9TKn6t7ZODKV7rkk4rmYBMQFAB0smgCHd0PqVduGW7k+0NWtb/8e7nRlDrYnXpspIJyARM/QDpZPh434hHt/1k/WyS4wxfu5NCLce1y6ua/k/5/rvbjzo59lK3MKWngQCkBoIKkE7sWb5pGUlhN7+vXhxUSBtqOW6FfZeKbW0hQopf6FoXAIg3ggqQbsqm+qZlHKcVhjqKQ07X+JftnppJCnQksveKtCYGAGJEjQqQjsqm+pYgR7Azbahlu4c0OLL3ibQmBgBixIgKkK7sWVLp5dJ51/v+7GH7/NOX7TZ4R+uAkS9v2DO617oAgBkYUQEgqfuy3faPfqCiV+edfDXE9min1boAgBkIKgACgpft3iwV5oW5Z9DilF2aDCC1EFQAhBdFrQsAmIGgAqBn/loXAEgCimkBAIBlEVQAAIBlEVQAAIBlEVQAAIBlUUwLoO+8XawMAmAKggqAvmlaHWavlSXstQKgz5j6ARC7ptXSqpnBIUWSPC2+402rk9MvAGmDoAIgNt4u30hK0Pb6fieP1S30tQOAGBFUAMRm36buIylBDMmz39cOAGJEjQoQD5lYTHr0YHzbAUAIBBWgrzK1mHRQYXzbAUAITP0AfZHJxaTDx/sCmWxhGtgkxxm+dgAQI4IKEKtMLya1Z/lGjSR1Dysnn1cvTv8pMACmIqgAsaKY1De1dcNTkqMo+Lij2Hc8nae+ACQENSpArCgm9SmbKo2+NvOKiQEkBEEF6cvslTgUk37CniWVXp7sXgBIQ6ZM/bz77ruaPXu2SktLNWDAAI0cOVI1NTU6fvx4UBubzdbtsXnzZjO6hEzTtFp6vFz6zf+R/jDb9+fj5fEtbqWYFABMZ8qIyq5du+T1evWLX/xCn/nMZ9TY2Kg5c+bo2LFjeuyxx4Larlu3Tueee27g+ZAhQ8zoEjKJfyXO6UWu/pU48aqd8BeTrpopX1g59f0oJgWAeLAZhhFqyULcPfroo1q2bJn++te/SvKNqJSWlmr79u0aO3ZszD/X4/HI6XTK7XbL4XDEqbeIly6voYbmNh1q71BBXq4qSvOVZQ83AhEH3i7fyEnYIlebbxRk/pvxCxAh91E5wxdSKCYFgJAi/f5OWI2K2+1Wfn5+t+NTp05VR0eHzjnnHN17772aOpVf7OmirrFFtWua1OLuCBwrcuaqZkqZqsuLejizD6JZiROvmgqKSQHANAkJKnv27NHPf/7zoGmfQYMG6Uc/+pEuvfRS2e12/eEPf9C0adP04osv9hhWOjs71dnZGXju8XhM7TtiU9fYorkrt3XbYaTV3aG5K7dp2Yxx5oSVZK3EoZgUAEwRVTHtwoULQxbAnvrYtWtX0Dn79+9XdXW1vvrVr2rOnDmB40OHDtWCBQtUWVmpiy++WIsXL9aMGTP06KOP9tiHRYsWyel0Bh4lJSXRXAISoMtrqHZNU0/boKl2TZO6vCbMOrISBwDSSlQ1Kh9++KEOHz7cY5sRI0YoOztbknTgwAFNmDBBl1xyiVasWCG7vedctHTpUv3gBz9QS0tL2DahRlRKSkqoUbGQ+r2HNf2Xva/e+t2cS1Q1Ms7F04EalRaF3jHWhBoVAEDUTKlRGTZsmIYNGxZR2/379+vzn/+8LrzwQi1fvrzXkCJJO3bsUFFRz9MBOTk5ysnJiagPSI5D7R29N4qiXVT6uBIn4cW/AIAemVKjsn//fk2YMEHDhw/XY489pg8//DDwmsvlkiT95je/UXZ2ti644AJJ0vPPP68nn3xSv/rVr8zoEhKoIC83ru2i5t/WPeQdjcOvxKlrbNHDq99UydH/VYGO6JAG6/1B5+uBqeeZV/wLAOiRKUFl7dq12rNnj/bs2aMzzzwz6LVTZ5oefvhh7du3T/369dPo0aP13HPP6frrrzejS0igitJ8FTlz1eruCDf5IpfTN1phmihX4tQ1tujFZ57Q7/s/peLstsDxA535euiZmdJNt/cYVhiJAQBzJGwfFbOwj4o1+Vf9SCEnX8xb9RODLq+hf/rhD/XDE49Ikk7NF/563+/1v1f/8r3vhQwfSVmGDQApLtLvb+6eDFNUlxdp2YxxcjmDp3dcztyoQ0qX11D93sN6acd+1e89HPfVQg17P9S3T/imHE/PIf7n3z7xazXs/VCn8weyU0OK9Mky7LrG8IXhAIDecVNCmKa6vEiTylx9mhJJxGhF17t/VrGtLezrdptUrMP667t/lj77pU/O62UZtk2+ZdiTylxMAwFAjBhRgamy7DZVjRyi68aeoaqRQ6IOKYkYrSiwHYmpXUNzW7e+ncqQ1OLuUENz+BAEAOgZQQWWlMhN40aOGBlTu0PtHbLLq0vsTZpq36RL7E2yy9vtPFOWYQNAhmDqB5YUzWhFXzeNyzr7Uv19gEs5H7d2q1GRfAW1nQNdGnD2pUHHR3+0Ua/n/HPQtNEBI1+1J2bqZW9F4Jhpy7ABIAMwogJLisemcREX4dqzNGDKo7LZbN3GQ7ySbDabBkx5NHhpc9NqnfPqPLlOq21xqU3L+j+uyfYG2eSrpzF1GTYApDlGVGBJfd00Luoi3LKpsoXYJM7mOEO20zeJ83b52snolvTtNt8ITE3/32pd50WqmVJGIS0A9AFBBZbUl03jYr5zc9lU2U7bJM4WapO4fZskzwGFix/+VUK/u7pLFeyjAgB9wtQPLCnLblPNlDJJ6hYI/M9DjVb0uQjXniWVXi6dd73vzxA72XrbWyO6houGnoioHQAgPIIKLCuWTeMSsWT47faBcW0HAAiPqR9YWrSbxiXizs17Bp6nTxv5cqkt7CqhVg3RnoHn6dyY3wUAIDGighQQzaZxibhzc4HjU6o9MVPSJ/cC8vM/rz3xdRU4PhXzewAAfAgqSCv+ItxwUSYeS4YrSvO1M+8K/d8T89Wq4J/TqiH6vyfma2feFSxLBoA4YOoHacVfhDt35TbZFPrOzX1dMvzJe3RobedFuti+SwU6okMarDe8o+WVXctYlgwAccGICtJOPO/c3Nt7FDgHarO3TKu947XZW6YC58C4vQcAQLIZhtH3m6UkkcfjkdPplNvtlsPhSHZ3YCFdXqNPd262ynsAQDqK9PubqR+kLX8Rbqq/BwBkMqZ+AACAZRFUAACAZRFUAACAZRFUAACAZVFMC6Qib1fQXZ4V6i7PAJAGCCpAqmlaLdXdJ3kOfHLMUSxVL5HKpiavXwBgAqZ+gFTStFpaNTM4pEiSp8V3vGl1cvoFACYhqACpwtvlG0lRqD0aTx6rW+hrBwBpgqACpIp9m7qPpAQxJM9+XzsASBMEFSBVHD0Y33YAkAIIKkCqGFQY33YAkAIIKkCqGD7et7pH4W56aJMcZ/jaAUCaYHkyzOXtkpr/JO173VfvWXq5dPZlke/54e2S3n3d9zNskoZf5vsZmbhniD3LtwR51Uz5PoxTi2pPhpfqxZn52QBIWzbDMEItIUgZkd4mGknQtFpa823p7x8FHx+QL035ae97fjStltbcJf297bTzPy1N+Vnm7hkSch+VM3whJVM/EwApJ9Lvb4IKzNG0Wlr19Z7b3PDb8F+sfT0/3bEzLYAUF+n3NzUqiD9vl/Tf9/beLtyeH4H9Qnrx3/dl7p4h9izfFNh512fuVBiAjEBQQfzt2yS1t/TeLtyeH73uF3JS+wH2DAGANGdaUDn77LNls9mCHosXLw5qs3PnTl1++eXKzc1VSUmJHnnkEbO6g0SKZh+PUG37ej4AIG2YuurnoYce0pw5cwLP8/LyAv/t8Xh09dVXa+LEiXriiSf05ptv6pvf/KYGDx6s2267zcxuwWzR7OMRqm1fzwcApA1Tg0peXp5cLlfI155++mkdP35cTz75pLKzs3Xuuedqx44d+vGPf0xQSXXDx0t5Rb1P/4Tb88O/X0hv0z95xewZAgBpztQalcWLF2vIkCG64IIL9Oijj+of//hH4LX6+npdccUVys7ODhybPHmydu/erY8++ijUj0OqsGdJX4xgGi/cnh8n9wsx1OPt96QvLqGIFADSnGlB5dvf/raeffZZvfLKK/rWt76lH/7wh7r33k9WgrS2tqqwMHjY3v+8tbU17M/t7OyUx+MJesCCyqb6lg8P+HT31wbk97q0uM57seYen6+PjEHdXvvIGKTtVRm8jwoAZJCopn4WLlyoJUuW9Njm7bff1ujRo7VgwYLAsTFjxig7O1vf+ta3tGjRIuXk5MTWW0mLFi1SbW1tzOcjgcqmSqOvjXpn2i6vodo1TWrxVuh/Oi9Spb1JVfYmyZDqjTI1eMtUsG2gXp9kKMsebjt5AEA6iGrDtw8//FCHDx/usc2IESOCpnP83nrrLZWXl2vXrl0aNWqUZs6cKY/HoxdffDHQ5pVXXtEXvvAFtbW16dOfDvH/xOUbUens7Aw893g8KikpSckN37q8hhqa23SovUMFebmqKM3ni1dS/d7Dmv7Lzb22+92cS1Q1ckgCegQAiLdIN3yLakRl2LBhGjZsWEwd2rFjh+x2uwoKCiRJVVVV+qd/+iedOHFC/fv3lyStXbtWo0aNChtSJCknJ6dPIzJWUdfY4hs1cHcEjhU5c1UzpUzV5UVJ7FnyHWrv6L1RFO0AAKnLlBqV+vp6Pf744/rf//1f/fWvf9XTTz+tu+++WzNmzAiEkJtuuknZ2dmaPXu23nrrLT333HP66U9/GjRllK7qGls0d+W2oJAiSa3uDs1duU11jRFslpbGCvJy49oOAJC6TFmenJOTo2effVbf//731dnZqdLSUt19991BIcTpdOp//ud/NG/ePF144YUaOnSoHnzwwbRfmuyvvwi3msUmqXZNkyaVudJmGijaKa6K0nwVOXPV6u4I+TnZJLmcvp8DAEhvpgSVcePGafPm3msMxowZoz/96U9mdMGyGprbAiMpdnlVYd+lAh3RIQ1Wg3e0vLKrxd2hhua2tKi/iGWKK8tuU82UMs1duU02BS9R9sebmillaRPkAADhmbrhG7rz11VMtjeopv9TKra1BV47YOSr9sRMveytSIv6C/8U1+mjIv4prmUzxoUNK9XlRVo2Y1y3kOOijgcAMgpBJcEK8nI12d6gZf0f7/aaS21a1v9xzT0xXwV5lyS+c3EUjymu6vIiTSpzsTIKADIYQSXBKoY7NSL7t5Ihnf59a7dJXkOqzf6thg1/IDkdjJNTp7hCMaSIpriy7La0mAIDAMTG1C300V3W+/Uq1OFuIcXPbpNcOqys9+sT27E4Y4kxACAeCCqJdvRgfNtZFEuMAQDxQFBJtEGFvbeJpp1F+ZcYh6smscm3+oclxgCAnhBUEm34eMlRLPX0Fe44w9cuhfmXGEvdr5QlxgCASBFUEs2eJVX7b+wY5iu8enGPN+1LFf4lxi5n8PSOy5nb49JkAAD8oropoRVFelMjy2laLdXdJ3kOfHLMcYYvpJRNTV6/TMDNFwEApzPlpoSIo7Kp0uhrpX2bfIWzgwp90z1pMJJyOpYYAwBiRVBJJnuWVHp5snsBAIBlUaMCAAAsi6ACAAAsi6ACAAAsi6ACAAAsi6ACAAAsi6ACAAAsi6ACAAAsi6ACAAAsi6ACAAAsi51pY+Xtyojt7wEASCaCSixC3lCw2HdX5DS7oSAAAMnE1E+0mlZLq2YGhxRJ8rT4jjetTk6/AABIQwSVaHi7fCMpMkK8ePJY3UJfOwAA0GcElWjs29R9JCWIIXn2+9oBAIA+I6hE4+jB+LYDAAA9IqhEY1BhfNsBAIAeseonlHBLj4eP963u8bQodJ2Kzff68PGJ7jEAAGmJoHK63pYeVy/xre6RTcFhxeb7o3ox+6kAABAnTP2cKpKlx2VTpRuekhxFwW0cxb7j7KMCAEDcMKLi1+vSY5tv6fHoa31hZPS17EwLAIDJCCp+0Sw9Lr3cF0pKL09Y9wAAyERM/fix9BgAAMshqPix9BgAAMsxJahs3LhRNpst5OONN96QJL377rshX9+8ebMZXerdyaXHhn/1zmkM2STHGSw9BgAggUwJKuPHj1dLS0vQ49Zbb1VpaakuuuiioLbr1q0LanfhhRea0aXe2bO0/dyFMgxD3tPqab2GZBiGtp97HwWzAAAkkCnFtNnZ2XK5XIHnJ06c0EsvvaQ777xTNlvwiMWQIUOC2iZLl9fQ/912psacmK+a/k+pWG2B11o1RA+d+Lr+d9uZen2SoSx76FEXAAAQXwlZ9bN69WodPnxYt9xyS7fXpk6dqo6ODp1zzjm69957NXVqcvYhaWhuU4u7Qy2q0NrOi1Rh36UCHdEhDVaDd7S8skvuDjU0t6lq5JCk9BEAgEyTkKDy61//WpMnT9aZZ54ZODZo0CD96Ec/0qWXXiq73a4//OEPmjZtml588cUew0pnZ6c6OzsDzz0eT1z6eKi9I/DfXtm12VvWazsAAGCuqGpUFi5cGLZI1v/YtWtX0DkffPCBXn75Zc2ePTvo+NChQ7VgwQJVVlbq4osv1uLFizVjxgw9+uijPfZh0aJFcjqdgUdJSUk0lxBWQV5uXNsBAIC+sxmGEWor1pA+/PBDHT58uMc2I0aMUHZ2duD5ww8/rJ///Ofav3+/+vfv3+O5S5cu1Q9+8AO1tLSEbRNqRKWkpERut1sOhyPCK+muy2vosiUb1OruCHe7QbmcuXr9vi9QowIAQB95PB45nc5ev7+jmvoZNmyYhg0bFnF7wzC0fPlyzZw5s9eQIkk7duxQUVFRj21ycnKUk5MTcR8ilWW3qWZKmeau3BbudoOqmVJGSAEAIIFMrVHZsGGDmpubdeutt3Z77Te/+Y2ys7N1wQUXSJKef/55Pfnkk/rVr35lZpd6VF1epGUzxql2TZNa3J/UoricuaqZUqbq8p5DFAAAiC9Tg8qvf/1rjR8/XqNHjw75+sMPP6x9+/apX79+Gj16tJ577jldf/31ZnapV9XlRZpU5lJDc5sOtXeoIC9XFaX5jKQAAJAEUdWoWFGkc1wAAMA6Iv3+5l4/AADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsggqAADAsvoluwOpqstrqKG5TYfaO1SQl6uK0nxl2W3J7hYAAGmFoBKDusYW1a5pUou7I3CsyJmrmillqi4vSmLPAABIL0z9RKmusUVzV24LCimS1Oru0NyV21TX2JKkngEAkH4IKlHo8hqqXdMkI8Rr/mO1a5rU5Q3VAgAARIugEoWG5rZuIymnMiS1uDvU0NyWuE4BAJDGCCpRONQePqTE0g4AAPSMoBKFgrzcuLYDAAA9I6hEoaI0X0XOXIVbhGyTb/VPRWl+IrsFAEDaIqhEIctuU82UMknqFlb8z2umlLGfCgAAcUJQiVJ1eZGWzRgnlzN4esflzNWyGePYRwUAgDhiw7cYVJcXaVKZi51pAQAwGUElRll2m6pGDkl2NwAASGtM/QAAAMsiqAAAAMsiqAAAAMsiqAAAAMsiqAAAAMsiqAAAAMsiqAAAAMsiqAAAAMsiqAAAAMtK+Z1pDcOQJHk8niT3BAAARMr/ve3/Hg8n5YNKe3u7JKmkpCTJPQEAANFqb2+X0+kM+7rN6C3KWJzX69WBAweUl5cnm838mwJ6PB6VlJTo/fffl8PhMP39rCjTP4NMv36JzyDTr1/iM8j065f6/hkYhqH29nYVFxfLbg9fiZLyIyp2u11nnnlmwt/X4XBk7D9Ov0z/DDL9+iU+g0y/fonPINOvX+rbZ9DTSIofxbQAAMCyCCoAAMCyCCpRysnJUU1NjXJycpLdlaTJ9M8g069f4jPI9OuX+Awy/fqlxH0GKV9MCwAA0hcjKgAAwLIIKgAAwLIIKgAAwLIIKgAAwLIIKhH4l3/5F40fP14DBw7U4MGDIzrnG9/4hmw2W9Cjurra3I6aJJbrNwxDDz74oIqKijRgwABNnDhR77zzjrkdNVFbW5tuvvlmORwODR48WLNnz9bRo0d7PGfChAnd/g3cfvvtCepx3y1dulRnn322cnNzVVlZqYaGhh7b//73v9fo0aOVm5ur8847T//1X/+VoJ6aI5rrX7FiRbe/69zc3AT2Nr5ee+01TZkyRcXFxbLZbHrxxRd7PWfjxo0aN26ccnJy9JnPfEYrVqwwvZ9mivYz2LhxY7d/AzabTa2trYnpcJwtWrRIF198sfLy8lRQUKBp06Zp9+7dvZ5nxu8BgkoEjh8/rq9+9auaO3duVOdVV1erpaUl8Pjd735nUg/NFcv1P/LII/rZz36mJ554Qlu2bNGnPvUpTZ48WR0dHSb21Dw333yz3nrrLa1du1Z//OMf9dprr+m2227r9bw5c+YE/Rt45JFHEtDbvnvuuee0YMEC1dTUaNu2bTr//PM1efJkHTp0KGT7TZs2afr06Zo9e7a2b9+uadOmadq0aWpsbExwz+Mj2uuXfLtznvp3vW/fvgT2OL6OHTum888/X0uXLo2ofXNzs6699lp9/vOf144dOzR//nzdeuutevnll03uqXmi/Qz8du/eHfTvoKCgwKQemuvVV1/VvHnztHnzZq1du1YnTpzQ1VdfrWPHjoU9x7TfAwYitnz5csPpdEbUdtasWcZ1111nan8SLdLr93q9hsvlMh599NHAsSNHjhg5OTnG7373OxN7aI6mpiZDkvHGG28Ejv33f/+3YbPZjP3794c978orrzTuuuuuBPQw/ioqKox58+YFnnd1dRnFxcXGokWLQra/4YYbjGuvvTboWGVlpfGtb33L1H6aJdrrj+Z3Q6qRZLzwwgs9trn33nuNc889N+jY1772NWPy5Mkm9ixxIvkMXnnlFUOS8dFHHyWkT4l26NAhQ5Lx6quvhm1j1u8BRlRMtHHjRhUUFGjUqFGaO3euDh8+nOwuJURzc7NaW1s1ceLEwDGn06nKykrV19cnsWexqa+v1+DBg3XRRRcFjk2cOFF2u11btmzp8dynn35aQ4cOVXl5ue6//359/PHHZne3z44fP66tW7cG/f3Z7XZNnDgx7N9ffX19UHtJmjx5ckr+fcdy/ZJ09OhRDR8+XCUlJbruuuv01ltvJaK7lpBOf/99NXbsWBUVFWnSpEn685//nOzuxI3b7ZYk5efnh21j1r+DlL8poVVVV1fry1/+skpLS7V3715973vf0xe/+EXV19crKysr2d0zlX9OtrCwMOh4YWFhSs7Xtra2dhu+7devn/Lz83u8nptuuknDhw9XcXGxdu7cqfvuu0+7d+/W888/b3aX++Rvf/uburq6Qv797dq1K+Q5ra2tafP3Hcv1jxo1Sk8++aTGjBkjt9utxx57TOPHj9dbb72VlJumJlq4v3+Px6O///3vGjBgQJJ6ljhFRUV64okndNFFF6mzs1O/+tWvNGHCBG3ZskXjxo1Ldvf6xOv1av78+br00ktVXl4etp1ZvwcyNqgsXLhQS5Ys6bHN22+/rdGjR8f082+88cbAf5933nkaM2aMRo4cqY0bN+qqq66K6WfGk9nXnwoi/QxidWoNy3nnnaeioiJdddVV2rt3r0aOHBnzz4X1VFVVqaqqKvB8/Pjx+tznPqdf/OIXevjhh5PYMyTKqFGjNGrUqMDz8ePHa+/evfrJT36i3/72t0nsWd/NmzdPjY2Nev3115Py/hkbVO655x594xvf6LHNiBEj4vZ+I0aM0NChQ7Vnzx5LBBUzr9/lckmSDh48qKKiosDxgwcPauzYsTH9TDNE+hm4XK5uRZT/+Mc/1NbWFrjWSFRWVkqS9uzZY+mgMnToUGVlZengwYNBxw8ePBj2el0uV1TtrSyW6z9d//79dcEFF2jPnj1mdNFywv39OxyOjBhNCaeioiJpX+7xcscddwQWEPQ2OmjW74GMDSrDhg3TsGHDEvZ+H3zwgQ4fPhz0xZ1MZl5/aWmpXC6X1q9fHwgmHo9HW7ZsiXrllJki/Qyqqqp05MgRbd26VRdeeKEkacOGDfJ6vYHwEYkdO3ZIkmX+DYSTnZ2tCy+8UOvXr9e0adMk+YZ+169frzvuuCPkOVVVVVq/fr3mz58fOLZ27dqgUYZUEcv1n66rq0tvvvmmrrnmGhN7ah1VVVXdlqGm6t9/PO3YscPy/3sPxzAM3XnnnXrhhRe0ceNGlZaW9nqOab8H+lSKmyH27dtnbN++3aitrTUGDRpkbN++3di+fbvR3t4eaDNq1Cjj+eefNwzDMNrb243vfOc7Rn19vdHc3GysW7fOGDdunPHZz37W6OjoSNZlxCza6zcMw1i8eLExePBg46WXXjJ27txpXHfddUZpaanx97//PRmX0GfV1dXGBRdcYGzZssV4/fXXjc9+9rPG9OnTA69/8MEHxqhRo4wtW7YYhmEYe/bsMR566CHjL3/5i9Hc3Gy89NJLxogRI4wrrrgiWZcQlWeffdbIyckxVqxYYTQ1NRm33XabMXjwYKO1tdUwDMP4+te/bixcuDDQ/s9//rPRr18/47HHHjPefvtto6amxujfv7/x5ptvJusS+iTa66+trTVefvllY+/evcbWrVuNG2+80cjNzTXeeuutZF1Cn7S3twf+dy7J+PGPf2xs377d2Ldvn2EYhrFw4ULj61//eqD9X//6V2PgwIHGd7/7XePtt982li5damRlZRl1dXXJuoQ+i/Yz+MlPfmK8+OKLxjvvvGO8+eabxl133WXY7XZj3bp1ybqEPpk7d67hdDqNjRs3Gi0tLYHHxx9/HGiTqN8DBJUIzJo1y5DU7fHKK68E2kgyli9fbhiGYXz88cfG1VdfbQwbNszo37+/MXz4cGPOnDmBX3KpJtrrNwzfEuUHHnjAKCwsNHJycoyrrrrK2L17d+I7HyeHDx82pk+fbgwaNMhwOBzGLbfcEhTUmpubgz6T9957z7jiiiuM/Px8Iycnx/jMZz5jfPe73zXcbneSriB6P//5z42zzjrLyM7ONioqKozNmzcHXrvyyiuNWbNmBbVftWqVcc455xjZ2dnGueeea/znf/5ngnscX9Fc//z58wNtCwsLjWuuucbYtm1bEnodH/6ltqc//Nc8a9Ys48orr+x2ztixY43s7GxjxIgRQb8PUlG0n8GSJUuMkSNHGrm5uUZ+fr4xYcIEY8OGDcnpfByEuvbTf88n6veA7WSHAAAALId9VAAAgGURVAAAgGURVAAAgGURVAAAgGURVAAAgGURVAAAgGURVAAAgGURVAAAgGURVAAAgGURVAAAgGURVAAAgGURVAAAgGX9f16nVjjTFyLvAAAAAElFTkSuQmCC", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "import matplotlib.pyplot as plt\n", + "\n", + "plt.scatter(X_test.ravel(), y_test)\n", + "plt.scatter(X_test.ravel(), y_pred)" + ] + }, + { + "cell_type": "markdown", + "id": "ec794d2a-6c68-4333-bc1b-06a5a139a9ab", + "metadata": {}, + "source": [ + "### Композиции алгоритмов" + ] + }, + { + "cell_type": "markdown", + "id": "00b241e5-1e39-467c-b3b3-3f634cad6df6", + "metadata": {}, + "source": [ + "Предположим, вы задаете сложный вопрос тысячам случайных людей и затем агрегируете их ответы. Во многих случаях вы обнаружите, что такой агрегированный ответ оказывается лучше, чем ответ эксперта. Это называется `коллективным разумом`.\n", + "\n", + "Аналогично если вы агрегируете прогнозы группы прогнозаторов (таких как классификаторы или регрессоры), то часто будете получать лучшие прогнозы, чем прогноз от наилучшего индивидуального прогнозатора. Группа прогнозаторов называется `ансамблем`. \n", + "\n", + "Cоответственно, прием носит название `ансамблевое обучение`, а алгоритм ансамблевого обучения именуется `ансамблевым методом`.\n", + "\n", + "Например, вы можете обучать группу классификаторов на основе деревьев принятия решений, задействовав для каждого отличающийся случайный поднабор обучающего набора. Для вырабатывания прогнозов вы лишь получаете прогнозы всех индивидуальных деревьев и прогнозируете класс, который стал обладателем большинства голосов. \n" + ] + }, + { + "cell_type": "markdown", + "id": "864fadb1-cae9-4c54-b840-e8a05bf8f775", + "metadata": {}, + "source": [ + "#### Bootstrap" + ] + }, + { + "cell_type": "markdown", + "id": "6dd32d51-0e93-486e-95c9-151c65e22842", + "metadata": {}, + "source": [ + "Можно представить себе мешок, из которого достают шарики: выбранный на каком-то шаге шарик возвращается обратно в мешок, и следующий выбор опять делается равновероятно из того же числа шариков. Отметим, что из-за возвращения среди них окажутся повторы." + ] + }, + { + "cell_type": "markdown", + "id": "ece89bd2-7d39-4799-991a-28dabb988616", + "metadata": {}, + "source": [ + "![](./imgs/sem4/bootstrap.jpg)" + ] + }, + { + "cell_type": "markdown", + "id": "061a316a-0359-47d4-bbe6-7b1093eb6469", + "metadata": {}, + "source": [ + "#### Bagging (от Bootstrap aggregation)\n", + "\n", + "Bagging - это обучение каждого алгоритма МО на одной из выборок (у каждого алгоритма своя выборка), полученной методом bootstrap, с последующим усреднением ответа от каждого предиктора - в случае регрессии, в случае классификации - ответ выбирается посредством голосования (какой класс предсказался больше всего раз, тот и выберем)." + ] + }, + { + "cell_type": "markdown", + "id": "8cf961d8-26cf-4ca1-9c83-c44fb5ae00f4", + "metadata": { + "tags": [] + }, + "source": [ + "![](./imgs/sem4/bagging.png)\n" + ] + }, + { + "cell_type": "markdown", + "id": "054a8a82-7d71-4b3e-a32d-25dc0281c959", + "metadata": {}, + "source": [ + "Эффективность бэггинга достигается благодаря тому, что базовые алгоритмы, обученные по различным подвыборкам, получаются достаточно различными, и их ошибки взаимно компенсируются при голосовании, а также за счёт того, что объекты-выбросы могут не попадать в некоторые обучающие подвыборки." + ] + }, + { + "cell_type": "markdown", + "id": "b34215e6-e821-4bae-84d3-d090386c9393", + "metadata": {}, + "source": [ + "В библиотеке `scikit-learn` есть реализации `BaggingRegressor` и `BaggingClassifier`, которые позволяют использовать большинство других алгоритмов \"внутри\"." + ] + }, + { + "cell_type": "markdown", + "id": "567199e8-ce12-4958-b2c9-f78a76996523", + "metadata": {}, + "source": [ + "Показанный ниже код обучает ансамбль из `500` классификаторов на основе деревьев принятия решений, каждый из которых обучается на `100` обучающих экземплярах, случайно выбранных из обучающего набора. \n", + "Параметр `n_jobs` сообщает `ScikitLearn` количество процессорных ядер для использования при обучении и прогнозировании (`-1`указывает на необходимость участия всех доступных ядер):" + ] + }, + { + "cell_type": "code", + "execution_count": 18, + "id": "a5b7a1a3-23df-4a5a-a842-87e4d130a033", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "0.9333333333333333" + ] + }, + "execution_count": 18, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from sklearn.ensemble import BaggingClassifier\n", + "from sklearn.tree import DecisionTreeClassifier\n", + "from sklearn.datasets import load_digits\n", + "from sklearn.metrics import accuracy_score\n", + "from sklearn.model_selection import train_test_split\n", + "\n", + "iris = load_digits()\n", + "X = iris.data\n", + "y = iris.target\n", + "\n", + "X_train, X_test, y_train, y_test = train_test_split(\n", + " X,\n", + " y,\n", + " test_size=0.2,\n", + " random_state=42\n", + ")\n", + "\n", + "bag_clf = BaggingClassifier(\n", + " DecisionTreeClassifier(),\n", + " n_estimators=500,\n", + " max_samples=100,\n", + " bootstrap=True,\n", + " n_jobs=-1)\n", + "\n", + "bag_clf.fit(X_train, y_train)\n", + "y_pred = bag_clf.predict(X_test)\n", + "\n", + "accuracy_score(y_test, y_pred)" + ] + }, + { + "cell_type": "markdown", + "id": "58547b38-4209-450c-bfac-7f9a19657e1d", + "metadata": {}, + "source": [ + "#### Случайный лес\n", + "\n", + "Такой ансамбль деревьев принятия решений называется `случайным лесом (random forest)` и, несмотря на свою простоту, является довольно мощным алгоритмов.\n", + "\n", + "Что случайного в случайном лесе:\n", + "\n", + " 1. Обучающие выборки, сформированные методом бутстрап\n", + " 2. Признаки для условий в каждом узле дерева (вместо поиска лучшего из лучших признаков при расщеплении узла он ищет наилучший признак в случайном поднаборе признаков)" + ] + }, + { + "cell_type": "markdown", + "id": "79b7b3e9-3a46-497a-b19b-b383848f87f9", + "metadata": {}, + "source": [ + "Вместо построения экземпляра `BaggingClassifier` и его передачи экземпляру `DecisionTreeClassifier` вы можете применить класс `RandomForestClassifier`, который является более удобным и оптимизированным для деревьев принятия решений (аналогичным образом имеется класс `RandomForestRegressor` для задач регрессии). \n", + "\n", + "Показанный ниже код обучает классификатор на основе случайного леса с `500` деревьями (каждое ограничено максимум `16` узлами), используя все доступные процессорные ядра:" + ] + }, + { + "cell_type": "code", + "execution_count": 24, + "id": "03d6f940-3325-4bb8-afa5-e8472f74a48e", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "0.975" + ] + }, + "execution_count": 24, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from sklearn.ensemble import RandomForestClassifier\n", + "from sklearn.datasets import load_digits\n", + "from sklearn.model_selection import train_test_split\n", + "from sklearn.metrics import accuracy_score\n", + "\n", + "\n", + "iris = load_digits()\n", + "X = iris.data\n", + "y = iris.target\n", + "\n", + "X_train, X_test, y_train, y_test = train_test_split(\n", + " X,\n", + " y,\n", + " test_size=0.2,\n", + " random_state=42\n", + ")\n", + "\n", + "rnd_clf = RandomForestClassifier(n_jobs=-1)\n", + "rnd_clf.fit(X_train, y_train)\n", + "\n", + "y_pred_rf = rnd_clf.predict(X_test)\n", + "\n", + "accuracy_score(y_test, y_pred_rf)" + ] + }, + { + "cell_type": "markdown", + "id": "62646b21-ee00-4836-893b-ddf57a9ab76b", + "metadata": {}, + "source": [ + "#### Градиентный бустинг" + ] + }, + { + "cell_type": "markdown", + "id": "4f157161-1635-47df-8dd1-e906e28ce095", + "metadata": {}, + "source": [ + "**Бустинг** — это техника построения ансамблей, в которой модели построены не независимо, а последовательно.\n", + "\n", + "**Градиентный бустинг** — это техника машинного обучения для задач классификации и регрессии, которая строит модель предсказания в форме ансамбля слабых предсказывающих моделей, обычно деревьев решений." + ] + }, + { + "cell_type": "code", + "execution_count": 25, + "id": "15fd3ead-d29b-4fb4-b386-bcb9db0b4acc", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "from sklearn.datasets import make_regression\n", + "import pandas as pd" + ] + }, + { + "cell_type": "code", + "execution_count": 26, + "id": "5b369f91-871a-483b-aa0e-2b5f66ec05bc", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "X, y = make_regression(\n", + " n_samples=100,\n", + " n_features=3,\n", + " n_informative=2,\n", + " noise=10\n", + ")" + ] + }, + { + "cell_type": "code", + "execution_count": 27, + "id": "91fa6840-4fff-498d-9fc7-7a722af03411", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "df = pd.DataFrame(X)\n", + "df['y_true'] = y" + ] + }, + { + "cell_type": "code", + "execution_count": 28, + "id": "4d707117-4a54-4a8a-8a31-405ac2ed7435", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
012y_true
0-0.135456-1.013084-1.430305-37.673161
11.8837660.5686110.391718184.487726
20.4280910.781200-0.43844940.129650
31.613016-0.7462721.112609178.316824
4-0.2858300.8999550.390032-18.258000
...............
95-1.1840450.025689-0.321175-118.370507
96-0.5155050.315502-1.474370-64.266387
97-0.382320-1.6356770.070134-32.789144
980.891264-0.674273-1.34981070.299484
990.9948680.685481-0.52653775.109633
\n", + "

100 rows × 4 columns

\n", + "
" + ], + "text/plain": [ + " 0 1 2 y_true\n", + "0 -0.135456 -1.013084 -1.430305 -37.673161\n", + "1 1.883766 0.568611 0.391718 184.487726\n", + "2 0.428091 0.781200 -0.438449 40.129650\n", + "3 1.613016 -0.746272 1.112609 178.316824\n", + "4 -0.285830 0.899955 0.390032 -18.258000\n", + ".. ... ... ... ...\n", + "95 -1.184045 0.025689 -0.321175 -118.370507\n", + "96 -0.515505 0.315502 -1.474370 -64.266387\n", + "97 -0.382320 -1.635677 0.070134 -32.789144\n", + "98 0.891264 -0.674273 -1.349810 70.299484\n", + "99 0.994868 0.685481 -0.526537 75.109633\n", + "\n", + "[100 rows x 4 columns]" + ] + }, + "execution_count": 28, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df" + ] + }, + { + "cell_type": "markdown", + "id": "466ffe90-3f98-4d8d-83aa-a1d04609f4d7", + "metadata": { + "tags": [] + }, + "source": [ + "Смысл бустинга заключается в том, что мы будем бустить какое-то константное предсказание.\n", + "\n", + "Добавим его в наш датасет:" + ] + }, + { + "cell_type": "code", + "execution_count": 29, + "id": "2e261a53-a4ea-4642-a747-5edc0b0879c7", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
012y_truey_pred_0
0-0.135456-1.013084-1.430305-37.67316131.267689
11.8837660.5686110.391718184.48772631.267689
20.4280910.781200-0.43844940.12965031.267689
31.613016-0.7462721.112609178.31682431.267689
4-0.2858300.8999550.390032-18.25800031.267689
..................
95-1.1840450.025689-0.321175-118.37050731.267689
96-0.5155050.315502-1.474370-64.26638731.267689
97-0.382320-1.6356770.070134-32.78914431.267689
980.891264-0.674273-1.34981070.29948431.267689
990.9948680.685481-0.52653775.10963331.267689
\n", + "

100 rows × 5 columns

\n", + "
" + ], + "text/plain": [ + " 0 1 2 y_true y_pred_0\n", + "0 -0.135456 -1.013084 -1.430305 -37.673161 31.267689\n", + "1 1.883766 0.568611 0.391718 184.487726 31.267689\n", + "2 0.428091 0.781200 -0.438449 40.129650 31.267689\n", + "3 1.613016 -0.746272 1.112609 178.316824 31.267689\n", + "4 -0.285830 0.899955 0.390032 -18.258000 31.267689\n", + ".. ... ... ... ... ...\n", + "95 -1.184045 0.025689 -0.321175 -118.370507 31.267689\n", + "96 -0.515505 0.315502 -1.474370 -64.266387 31.267689\n", + "97 -0.382320 -1.635677 0.070134 -32.789144 31.267689\n", + "98 0.891264 -0.674273 -1.349810 70.299484 31.267689\n", + "99 0.994868 0.685481 -0.526537 75.109633 31.267689\n", + "\n", + "[100 rows x 5 columns]" + ] + }, + "execution_count": 29, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df['y_pred_0'] = df['y_true'].mean()\n", + "df" + ] + }, + { + "cell_type": "code", + "execution_count": 30, + "id": "10da4ca2-3805-41b9-a7d2-6db0ae76f6b5", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "from sklearn.metrics import mean_absolute_error" + ] + }, + { + "cell_type": "code", + "execution_count": 31, + "id": "81a82086-3e53-44d0-8a53-68ede019b2f2", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/plain": [ + "83.64294087330029" + ] + }, + "execution_count": 31, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "mean_absolute_error(df['y_true'], df['y_pred_0'])" + ] + }, + { + "cell_type": "markdown", + "id": "78decd4b-b981-4eb4-9952-5d1f9fef7669", + "metadata": {}, + "source": [ + "Чтобы начать градиентный бустинг, нам нужно посчитать разницу, чтобы наш алгоритм обучался на ошибках предыдущего." + ] + }, + { + "cell_type": "code", + "execution_count": 32, + "id": "984accca-7899-4733-b533-3ddd0d48563c", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "df['residual_0'] = df['y_true'] - df['y_pred_0']" + ] + }, + { + "cell_type": "code", + "execution_count": 33, + "id": "78f4f69e-f370-4a96-8e38-23887c32980f", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
012y_truey_pred_0residual_0
0-0.135456-1.013084-1.430305-37.67316131.267689-68.940850
11.8837660.5686110.391718184.48772631.267689153.220037
20.4280910.781200-0.43844940.12965031.2676898.861961
31.613016-0.7462721.112609178.31682431.267689147.049135
4-0.2858300.8999550.390032-18.25800031.267689-49.525689
.....................
95-1.1840450.025689-0.321175-118.37050731.267689-149.638196
96-0.5155050.315502-1.474370-64.26638731.267689-95.534076
97-0.382320-1.6356770.070134-32.78914431.267689-64.056833
980.891264-0.674273-1.34981070.29948431.26768939.031795
990.9948680.685481-0.52653775.10963331.26768943.841944
\n", + "

100 rows × 6 columns

\n", + "
" + ], + "text/plain": [ + " 0 1 2 y_true y_pred_0 residual_0\n", + "0 -0.135456 -1.013084 -1.430305 -37.673161 31.267689 -68.940850\n", + "1 1.883766 0.568611 0.391718 184.487726 31.267689 153.220037\n", + "2 0.428091 0.781200 -0.438449 40.129650 31.267689 8.861961\n", + "3 1.613016 -0.746272 1.112609 178.316824 31.267689 147.049135\n", + "4 -0.285830 0.899955 0.390032 -18.258000 31.267689 -49.525689\n", + ".. ... ... ... ... ... ...\n", + "95 -1.184045 0.025689 -0.321175 -118.370507 31.267689 -149.638196\n", + "96 -0.515505 0.315502 -1.474370 -64.266387 31.267689 -95.534076\n", + "97 -0.382320 -1.635677 0.070134 -32.789144 31.267689 -64.056833\n", + "98 0.891264 -0.674273 -1.349810 70.299484 31.267689 39.031795\n", + "99 0.994868 0.685481 -0.526537 75.109633 31.267689 43.841944\n", + "\n", + "[100 rows x 6 columns]" + ] + }, + "execution_count": 33, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df" + ] + }, + { + "cell_type": "markdown", + "id": "7aea6601-8dc0-4030-8826-993f20e21ef0", + "metadata": { + "tags": [] + }, + "source": [ + "Обучим дерево решений на этой ошибке:" + ] + }, + { + "cell_type": "code", + "execution_count": 35, + "id": "1738278c-6740-440e-8174-d84df07364ff", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "
DecisionTreeRegressor(max_depth=1)
In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.
" + ], + "text/plain": [ + "DecisionTreeRegressor(max_depth=1)" + ] + }, + "execution_count": 35, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from sklearn.tree import DecisionTreeRegressor\n", + "\n", + "tree_1 = DecisionTreeRegressor(max_depth=1)\n", + "tree_1.fit(df[[0,1,2]], df[['residual_0']])" + ] + }, + { + "cell_type": "code", + "execution_count": 36, + "id": "a133c7a3-44ca-4371-b163-90395ed05e2f", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "df['tree_pred_1'] = tree_1.predict(df[[0,1,2]])" + ] + }, + { + "cell_type": "code", + "execution_count": 37, + "id": "e8c8c5d9-fb94-46cf-b939-49e33a9e2369", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
012y_truey_pred_0residual_0tree_pred_1
0-0.135456-1.013084-1.430305-37.67316131.267689-68.940850-84.433122
11.8837660.5686110.391718184.48772631.267689153.22003781.122019
20.4280910.781200-0.43844940.12965031.2676898.86196181.122019
31.613016-0.7462721.112609178.31682431.267689147.04913581.122019
4-0.2858300.8999550.390032-18.25800031.267689-49.525689-84.433122
........................
95-1.1840450.025689-0.321175-118.37050731.267689-149.638196-84.433122
96-0.5155050.315502-1.474370-64.26638731.267689-95.534076-84.433122
97-0.382320-1.6356770.070134-32.78914431.267689-64.056833-84.433122
980.891264-0.674273-1.34981070.29948431.26768939.03179581.122019
990.9948680.685481-0.52653775.10963331.26768943.84194481.122019
\n", + "

100 rows × 7 columns

\n", + "
" + ], + "text/plain": [ + " 0 1 2 y_true y_pred_0 residual_0 \\\n", + "0 -0.135456 -1.013084 -1.430305 -37.673161 31.267689 -68.940850 \n", + "1 1.883766 0.568611 0.391718 184.487726 31.267689 153.220037 \n", + "2 0.428091 0.781200 -0.438449 40.129650 31.267689 8.861961 \n", + "3 1.613016 -0.746272 1.112609 178.316824 31.267689 147.049135 \n", + "4 -0.285830 0.899955 0.390032 -18.258000 31.267689 -49.525689 \n", + ".. ... ... ... ... ... ... \n", + "95 -1.184045 0.025689 -0.321175 -118.370507 31.267689 -149.638196 \n", + "96 -0.515505 0.315502 -1.474370 -64.266387 31.267689 -95.534076 \n", + "97 -0.382320 -1.635677 0.070134 -32.789144 31.267689 -64.056833 \n", + "98 0.891264 -0.674273 -1.349810 70.299484 31.267689 39.031795 \n", + "99 0.994868 0.685481 -0.526537 75.109633 31.267689 43.841944 \n", + "\n", + " tree_pred_1 \n", + "0 -84.433122 \n", + "1 81.122019 \n", + "2 81.122019 \n", + "3 81.122019 \n", + "4 -84.433122 \n", + ".. ... \n", + "95 -84.433122 \n", + "96 -84.433122 \n", + "97 -84.433122 \n", + "98 81.122019 \n", + "99 81.122019 \n", + "\n", + "[100 rows x 7 columns]" + ] + }, + "execution_count": 37, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df" + ] + }, + { + "cell_type": "markdown", + "id": "b8abd1de-75ea-4b29-b872-f6eb0a2c76e7", + "metadata": {}, + "source": [ + "Теперь забустим наше первоначальное предсказание. Для этого полученные предсказания первого дерева нужно умножить на learning rate и прибавить к константному предсказанию. Таким образом мы приблизимся на шаг и истинным значениям." + ] + }, + { + "cell_type": "code", + "execution_count": 38, + "id": "669f9a1b-10bd-4c4e-9af6-0310813bcede", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "lr = 0.1\n", + "df['y_pred_1'] = df['y_pred_0'] + lr * df['tree_pred_1']" + ] + }, + { + "cell_type": "code", + "execution_count": 39, + "id": "dc0ceec8-9334-4198-97d7-c1d8e88aaa5c", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
012y_truey_pred_0residual_0tree_pred_1y_pred_1
0-0.135456-1.013084-1.430305-37.67316131.267689-68.940850-84.43312222.824377
11.8837660.5686110.391718184.48772631.267689153.22003781.12201939.379891
20.4280910.781200-0.43844940.12965031.2676898.86196181.12201939.379891
31.613016-0.7462721.112609178.31682431.267689147.04913581.12201939.379891
4-0.2858300.8999550.390032-18.25800031.267689-49.525689-84.43312222.824377
...........................
95-1.1840450.025689-0.321175-118.37050731.267689-149.638196-84.43312222.824377
96-0.5155050.315502-1.474370-64.26638731.267689-95.534076-84.43312222.824377
97-0.382320-1.6356770.070134-32.78914431.267689-64.056833-84.43312222.824377
980.891264-0.674273-1.34981070.29948431.26768939.03179581.12201939.379891
990.9948680.685481-0.52653775.10963331.26768943.84194481.12201939.379891
\n", + "

100 rows × 8 columns

\n", + "
" + ], + "text/plain": [ + " 0 1 2 y_true y_pred_0 residual_0 \\\n", + "0 -0.135456 -1.013084 -1.430305 -37.673161 31.267689 -68.940850 \n", + "1 1.883766 0.568611 0.391718 184.487726 31.267689 153.220037 \n", + "2 0.428091 0.781200 -0.438449 40.129650 31.267689 8.861961 \n", + "3 1.613016 -0.746272 1.112609 178.316824 31.267689 147.049135 \n", + "4 -0.285830 0.899955 0.390032 -18.258000 31.267689 -49.525689 \n", + ".. ... ... ... ... ... ... \n", + "95 -1.184045 0.025689 -0.321175 -118.370507 31.267689 -149.638196 \n", + "96 -0.515505 0.315502 -1.474370 -64.266387 31.267689 -95.534076 \n", + "97 -0.382320 -1.635677 0.070134 -32.789144 31.267689 -64.056833 \n", + "98 0.891264 -0.674273 -1.349810 70.299484 31.267689 39.031795 \n", + "99 0.994868 0.685481 -0.526537 75.109633 31.267689 43.841944 \n", + "\n", + " tree_pred_1 y_pred_1 \n", + "0 -84.433122 22.824377 \n", + "1 81.122019 39.379891 \n", + "2 81.122019 39.379891 \n", + "3 81.122019 39.379891 \n", + "4 -84.433122 22.824377 \n", + ".. ... ... \n", + "95 -84.433122 22.824377 \n", + "96 -84.433122 22.824377 \n", + "97 -84.433122 22.824377 \n", + "98 81.122019 39.379891 \n", + "99 81.122019 39.379891 \n", + "\n", + "[100 rows x 8 columns]" + ] + }, + "execution_count": 39, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "df" + ] + }, + { + "cell_type": "markdown", + "id": "be1eda59-4685-42d2-bed3-0d2c1f25bb53", + "metadata": { + "tags": [] + }, + "source": [ + "Посчитаем ошибку и убедимся что она уменьшилась:" + ] + }, + { + "cell_type": "code", + "execution_count": 40, + "id": "8dc0f80c-e85a-4dfd-817a-fa1ff7e8a8e8", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Было: 83.64294087330029\n", + "Стало: 76.18633734863174\n" + ] + } + ], + "source": [ + "print(f\"Было: {mean_absolute_error(df['y_true'], df['y_pred_0'])}\")\n", + "print(f\"Стало: {mean_absolute_error(df['y_true'], df['y_pred_1'])}\")" + ] + }, + { + "cell_type": "markdown", + "id": "7ba9c503-88ff-4d72-8204-6cc6239f7524", + "metadata": {}, + "source": [ + "Таким образом, мы забустили константное предсказание.\n", + "\n", + "Далее алгоритм для следующего дерева такой же:\n", + "- Посчитать разницу между последним предсказанием и истинным значением\n", + "- Обучить новое дерево на этой разнице\n", + "- Предсказываем значения на новом дереве\n", + "- Делаем шаг от прошлого предсказания в сторону истинных значений\n", + " \n", + "Обернем все в цикл:" + ] + }, + { + "cell_type": "code", + "execution_count": 46, + "id": "97a1cbbf-56da-4e23-b828-cc87d5552515", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "data": { + "text/html": [ + "
\n", + "\n", + "\n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + " \n", + "
012y_truey_pred
0-0.135456-1.013084-1.430305-37.67316131.267689
11.8837660.5686110.391718184.48772631.267689
20.4280910.781200-0.43844940.12965031.267689
31.613016-0.7462721.112609178.31682431.267689
4-0.2858300.8999550.390032-18.25800031.267689
..................
95-1.1840450.025689-0.321175-118.37050731.267689
96-0.5155050.315502-1.474370-64.26638731.267689
97-0.382320-1.6356770.070134-32.78914431.267689
980.891264-0.674273-1.34981070.29948431.267689
990.9948680.685481-0.52653775.10963331.267689
\n", + "

100 rows × 5 columns

\n", + "
" + ], + "text/plain": [ + " 0 1 2 y_true y_pred\n", + "0 -0.135456 -1.013084 -1.430305 -37.673161 31.267689\n", + "1 1.883766 0.568611 0.391718 184.487726 31.267689\n", + "2 0.428091 0.781200 -0.438449 40.129650 31.267689\n", + "3 1.613016 -0.746272 1.112609 178.316824 31.267689\n", + "4 -0.285830 0.899955 0.390032 -18.258000 31.267689\n", + ".. ... ... ... ... ...\n", + "95 -1.184045 0.025689 -0.321175 -118.370507 31.267689\n", + "96 -0.515505 0.315502 -1.474370 -64.266387 31.267689\n", + "97 -0.382320 -1.635677 0.070134 -32.789144 31.267689\n", + "98 0.891264 -0.674273 -1.349810 70.299484 31.267689\n", + "99 0.994868 0.685481 -0.526537 75.109633 31.267689\n", + "\n", + "[100 rows x 5 columns]" + ] + }, + "execution_count": 46, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "train = df[[0,1,2,'y_true']].copy()\n", + "train['y_pred'] = train['y_true'].mean()\n", + "train" + ] + }, + { + "cell_type": "code", + "execution_count": 47, + "id": "d79bc2fe-bd41-4336-b2fa-ea464c0c5561", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Дерево 1: MAE=76.18633734863174\n", + "Дерево 2: MAE=69.78839469511819\n", + "Дерево 3: MAE=65.23121406231614\n", + "Дерево 4: MAE=59.80214563570313\n", + "Дерево 5: MAE=55.92610812568657\n", + "Дерево 6: MAE=52.97726287762965\n", + "Дерево 7: MAE=49.89017878618041\n", + "Дерево 8: MAE=47.449637517710016\n", + "Дерево 9: MAE=44.10842265940846\n", + "Дерево 10: MAE=41.8402034112005\n" + ] + } + ], + "source": [ + "n_trees = 10\n", + "lr = 0.1\n", + "\n", + "trees = []\n", + "for i in range(n_trees):\n", + " train['residual'] = train['y_true'] - train['y_pred']\n", + " tree = DecisionTreeRegressor(max_depth=1)\n", + " tree.fit(train[[0,1,2]], train[['residual']])\n", + " trees.append(tree)\n", + " train['y_pred'] += lr * tree.predict(train[[0,1,2]])\n", + " print(f\"Дерево {i + 1}: MAE={mean_absolute_error(train['y_true'], train['y_pred'])}\")\n", + " \n", + " " + ] + }, + { + "cell_type": "markdown", + "id": "809d87c5-c9b8-46b9-9ebd-f995f6ca8960", + "metadata": {}, + "source": [ + "Таким образом мы обучили наши деревья, давайте напишем инференс(сделаем предсказание) по ним.\n", + "\n", + "Чтобы сделать предсказание, нужно так же сначала сделать констатное предсказание." + ] + }, + { + "cell_type": "code", + "execution_count": 48, + "id": "ad38fdcb-72f0-45f1-abcf-5aef77ed52eb", + "metadata": { + "tags": [] + }, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "MAE: 41.8402034112005\n" + ] + } + ], + "source": [ + "test = df[[0,1,2,'y_true']].copy()\n", + "test['y_pred'] = test['y_true'].mean()\n", + "\n", + "for tree in trees:\n", + " test['y_pred'] += lr * tree.predict(df[[0,1,2]])\n", + " \n", + "print(f\"MAE: {mean_absolute_error(test['y_true'], test['y_pred'])}\")" + ] + }, + { + "cell_type": "markdown", + "id": "a643006a-2854-469b-9292-4e52e32d2f50", + "metadata": {}, + "source": [ + "#### Популярные библиотеки для градиентного бустинга\n", + "\n" + ] + }, + { + "cell_type": "markdown", + "id": "ae6631b3-d2f2-4cc4-a7f0-f28d3dbbee76", + "metadata": { + "tags": [] + }, + "source": [ + "- [CatBoost](https://catboost.ai/en/docs/)\n", + "- [LightGBM](https://lightgbm.readthedocs.io/en/v3.3.2/#)\n", + "- [XGBoost](https://xgboost.readthedocs.io/en/stable/#)\n", + "\n", + "CatBoost, LightGBM и XGBoost - это три популярные библиотеки градиентного бустинга, которые широко используются для решения задач машинного обучения. Вот несколько основных различий между ними:\n", + "\n", + "1. Обработка категориальных признаков: CatBoost и LightGBM предоставляют встроенные механизмы для автоматической обработки категориальных признаков, в то время как в XGBoost необходимо предварительно выполнять преобразования для кодирования категориальных признаков в числовые значения.\n", + "\n", + "2. Оптимизация памяти и скорость обучения: LightGBM и CatBoost изначально были разработаны с акцентом на оптимизацию памяти и производительность. Они используют различные алгоритмы для сжатия данных и оптимизации работы с памятью, что делает их более эффективными на больших наборах данных и быстрее в обучении моделей, по сравнению с XGBoost.\n", + "\n", + "3. Поддержка работы с категориальными признаками не только в деревьях, но и в линейных моделях: CatBoost позволяет использовать категориальные признаки не только в деревьях, но и в линейных моделях, что может быть полезно в некоторых задачах. LightGBM также поддерживает использование категориальных признаков в линейных моделях, но XGBoost поддерживает только использование категориальных признаков в деревьях.\n", + "\n", + "4. Автоматическая обработка пропущенных значений: CatBoost автоматически обрабатывает пропущенные значения в данных без необходимости предварительной обработки, в то время как LightGBM и XGBoost требуют явного заполнения пропущенных значений перед обучением моделей.\n", + "\n", + "5. Работа с несбалансированными данными: CatBoost и XGBoost предлагают встроенные механизмы для работы с несбалансированными данными, такими как автоматическое балансирование классов, в то время как LightGBM требует явного указания параметров модели для работы с несбалансированными данными." + ] + }, + { + "cell_type": "markdown", + "id": "b9f76cfa-75f2-4133-b521-a0686050b3b2", + "metadata": {}, + "source": [ + "### CatBoost\n", + "\n", + "Библиотека CatBoost – это градиентный бустинговый фреймворк с открытым исходным кодом, разработанный компанией Yandex." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "46c1ea73-eee7-4bb1-8127-31dc96facf4c", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "# !pip install catboost" + ] + }, + { + "cell_type": "markdown", + "id": "bf28abb0-b5ef-449b-876d-5d46805bd148", + "metadata": {}, + "source": [ + "В этом примере мы использовали функцию `make_regression` из библиотеки `scikit-learn` для генерации синтетических данных для задачи регрессии. Затем мы создали и обучили модель `CatBoostRegressor`, указав индексы категориальных признаков в параметре `cat_features`. Наконец, мы оценили качество модели на тестовом наборе данных с помощью среднеквадратичной ошибки (`MSE`)." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "e4f2aa8e-fdfc-4759-81e3-cf7bcde33999", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "import numpy as np\n", + "from sklearn.datasets import make_regression\n", + "from sklearn.model_selection import train_test_split\n", + "from catboost import CatBoostRegressor\n", + "\n", + "# Генерация синтетических данных\n", + "X, y = make_regression(n_samples=1000, n_features=5, n_informative=3, random_state=42)\n", + "X = np.round(X) # Округление признаков до целых чисел\n", + "X = X.astype(int) # Преобразование признаков в целочисленный тип данных\n", + "cat_features = [0, 2, 4] # Индексы категориальных признаков\n", + "\n", + "# Разделение данных на обучающий и тестовый наборы\n", + "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)\n", + "\n", + "# Создание и обучение модели CatBoostRegressor\n", + "model = CatBoostRegressor(iterations=1000, # Количество итераций\n", + " learning_rate=0.1, # Скорость обучения\n", + " depth=6, # Глубина дерева\n", + " cat_features=cat_features, # Индексы категориальных признаков\n", + " random_state=42) # Задаем случайное начальное состояние для воспроизводимости\n", + "\n", + "model.fit(X_train, y_train, verbose=100) # Обучение модели с выводом прогресса на каждой 100-й итерации\n", + "\n", + "# Прогнозирование на тестовом наборе данных\n", + "y_pred = model.predict(X_test)\n", + "\n", + "# Оценка качества модели\n", + "mse = np.mean((y_test - y_pred) ** 2) # Среднеквадратичная ошибка\n", + "print(f\"Mean Squared Error: {mse:.4f}\")\n", + "\n" + ] + }, + { + "cell_type": "markdown", + "id": "9d40af0a-89a9-467e-98e6-e7853f12e311", + "metadata": {}, + "source": [ + "#### LightGBM\n", + "\n", + "LightGBM - это эффективная библиотека градиентного бустинга, разработанная Microsoft, которая обладает высокой производительностью благодаря оптимизации памяти и быстрым алгоритмам обучения." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "5de56b14-4056-4e13-a12f-b4578597862d", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "# !pip install lightgbm" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "86316bc6-4315-4cec-8386-59e758d407a3", + "metadata": {}, + "outputs": [], + "source": [ + "import numpy as np\n", + "import pandas as pd\n", + "from sklearn.datasets import make_regression\n", + "from sklearn.model_selection import train_test_split\n", + "import lightgbm as lgb\n", + "\n", + "# Генерация синтетических данных\n", + "X, y = make_regression(n_samples=1000, n_features=5, n_informative=3, random_state=42)\n", + "X = np.round(X) # Округление признаков до целых чисел\n", + "\n", + "# Создание DataFrame из массивов NumPy\n", + "df = pd.DataFrame(X, columns=[f\"feature_{i}\" for i in range(X.shape[1])])\n", + "df[\"cat_feature\"] = np.random.choice([\"A\", \"B\", \"C\"], size=X.shape[0]) # Добавление категориального признака\n", + "df['cat_feature'] = df['cat_feature'].astype('category')\n", + "cat_features = [\"cat_feature\"] # Список категориальных признаков\n", + "\n", + "# Разделение данных на обучающий и тестовый наборы\n", + "X_train, X_test, y_train, y_test = train_test_split(df, y, test_size=0.2, random_state=42)\n", + "\n", + "# Создание и обучение модели LGBMRegressor\n", + "model = lgb.LGBMRegressor(num_leaves=31, # Количество листьев в дереве\n", + " learning_rate=0.1, # Скорость обучения\n", + " n_estimators=100, # Количество деревьев\n", + " categorical_feature=cat_features, # Список категориальных признаков\n", + " random_state=42) # Задаем случайное начальное состояние для воспроизводимости\n", + "model.fit(X_train, y_train, verbose=10) # Обучение модели с выводом прогресса на каждой 10-й итерации\n", + "\n", + "# Прогнозирование на тестовом наборе данных\n", + "y_pred = model.predict(X_test)\n", + "\n", + "# Оценка качества модели\n", + "mse = np.mean((y_test - y_pred) ** 2) # Среднеквадратичная ошибка\n", + "print(f\"Mean Squared Error: {mse:.4f}\")\n" + ] + }, + { + "cell_type": "markdown", + "id": "35896ec9-b40e-4885-bc3b-e5fcc5d97f6b", + "metadata": {}, + "source": [ + "В этом примере мы использовали функцию `make_regression` из библиотеки `scikit-learn` для генерации синтетических данных для задачи регрессии. Затем мы создали `DataFrame` из массивов `NumPy`, добавили категориальный признак в `DataFrame` с помощью библиотеки `pandas`, и указали его в параметре `categorical_feature` при создании и обучении модели `LGBMRegressor`. Наконец, мы оценили качество модели на тестовом наборе данных с помощью среднеквадратичной ошибки (`MSE`)." + ] + }, + { + "cell_type": "markdown", + "id": "c6d4294c-d241-46e3-8391-87d321752ff9", + "metadata": {}, + "source": [ + "#### XGBoost\n", + "\n", + "Библиотека XGBoost была разработана и представлена в 2014 году Даниэлем Ченом (Daniel Chen) - исследователем в области машинного обучения и анализа данных. Он разработал XGBoost в рамках своей докторской диссертации на университете Вашингтона (University of Washington), и с тех пор библиотека стала одним из наиболее популярных инструментов машинного обучения, широко применяемых в индустрии и академическом сообществе. В настоящее время XGBoost поддерживается и развивается открытым сообществом разработчиков." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "9fbb2cb4-79b8-442b-a48c-6981567bd05a", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "# !pip install xgboost" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "de909c76-3e75-4502-99ae-c35854cad3b3", + "metadata": { + "tags": [] + }, + "outputs": [], + "source": [ + "import numpy as np\n", + "import xgboost as xgb\n", + "from sklearn.datasets import make_regression\n", + "from sklearn.model_selection import train_test_split\n", + "\n", + "# Создание синтетических данных с категориальными признаками\n", + "X, y = make_regression(n_samples=1000, n_features=5, n_informative=3, random_state=42)\n", + "X = np.round(X) # Округление признаков до целых чисел\n", + "X = X.astype(int) # Приведение типа данных к целочисленному\n", + "\n", + "# Разделение данных на обучающую и тестовую выборки\n", + "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)\n", + "\n", + "# Создание объекта DMatrix для обучающей и тестовой выборок\n", + "dtrain = xgb.DMatrix(X_train, label=y_train)\n", + "dtest = xgb.DMatrix(X_test, label=y_test)\n", + "\n", + "# Определение параметров модели\n", + "params = {\n", + " 'booster': 'gbtree',\n", + " 'objective': 'reg:squarederror',\n", + " 'eval_metric': 'rmse',\n", + " 'max_depth': 3,\n", + " 'eta': 0.1,\n", + " 'subsample': 0.8,\n", + " 'colsample_bytree': 0.8,\n", + " 'alpha': 0.1,\n", + " 'lambda': 0.1,\n", + " 'min_child_weight': 1,\n", + " 'seed': 42\n", + "}\n", + "\n", + "# Обучение модели XGBoost\n", + "num_rounds = 100\n", + "model = xgb.train(params, dtrain, num_rounds)\n", + "\n", + "# Прогнозирование на тестовой выборке\n", + "y_pred = model.predict(dtest)\n", + "\n", + "# Оценка качества модели\n", + "rmse = np.sqrt(np.mean((y_pred - y_test) ** 2))\n", + "print(f'RMSE на тестовой выборке: {rmse:.4f}')\n" + ] + }, + { + "cell_type": "markdown", + "id": "0f713d2b-391e-42b3-a39b-2d6ba9d5a66b", + "metadata": {}, + "source": [ + "В данном примере мы создаем синтетические данные с категориальными признаками, разделяем их на обучающую и тестовую выборки, создаем объекты DMatrix для этих выборок, определяем параметры модели XGBoost, обучаем модель и оцениваем ее качество на тестовой выборке с помощью метрики RMSE (корень из среднеквадратической ошибки)." + ] + }, + { + "cell_type": "markdown", + "id": "f1f22246-ab30-4417-919a-06f7c01ff754", + "metadata": {}, + "source": [ + "### Как подобрать наилучшие гиперпараметры для модели" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "2bc29d71-8ce6-4f21-98c2-e1ce75da126b", + "metadata": {}, + "outputs": [], + "source": [ + "import numpy as np\n", + "from sklearn.datasets import make_regression\n", + "from sklearn.model_selection import train_test_split, GridSearchCV\n", + "from catboost import CatBoostRegressor\n", + "\n", + "# Генерация данных\n", + "X, y = make_regression(n_samples=1000, n_features=10, noise=0.1, random_state=42)\n", + "X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)\n", + "\n", + "# Создание модели CatBoostRegressor\n", + "model = CatBoostRegressor()\n", + "\n", + "# Определение гиперпараметров и их значений для подбора\n", + "param_grid = {\n", + " 'learning_rate': [0.01, 0.1, 0.2],\n", + " 'depth': [4, 6, 8],\n", + " 'iterations': [100, 200, 300]\n", + "}\n", + "\n", + "# Подбор гиперпараметров с использованием GridSearchCV\n", + "grid_search = GridSearchCV(model, param_grid, cv=3)\n", + "grid_search.fit(X_train, y_train)\n", + "\n", + "# Вывод наилучших параметров и значения метрик\n", + "print(\"Наилучшие параметры: \", grid_search.best_params_)\n", + "print(\"Наилучшее значение RMSE на тестовом наборе: \", np.sqrt(-grid_search.score(X_test, y_test)))\n" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "2cdd7b0b-c60e-4086-9728-af6439587676", + "metadata": {}, + "outputs": [], + "source": [] + }, + { + "cell_type": "markdown", + "id": "a6a79e09-5af5-40e9-afb0-3596ea6e1fe0", + "metadata": {}, + "source": [ + "## Лаб 4\n", + "\n", + "Узнать какой бустинг и с какими гиперпараметрами лучше работает на вашем наборе данных.\n", + "\n", + "Обучить простую модель и бустинг, сравнить модели по какой-нибудь метрике." + ] + }, + { + "cell_type": "code", + "execution_count": null, + "id": "ed0f5b5a-ad97-4681-8459-d03df4f4820c", + "metadata": {}, + "outputs": [], + "source": [] + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3 (ipykernel)", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.8.16" + } + }, + "nbformat": 4, + "nbformat_minor": 5 +}