新网创想网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
random库是使用随机数的Python标准库
在江永等地区,都构建了全面的区域性战略布局,加强发展的系统性、市场前瞻性、产品创新能力,以专注、极致的服务理念,为客户提供成都网站建设、网站建设 网站设计制作按需定制,公司网站建设,企业网站建设,品牌网站制作,营销型网站,成都外贸网站制作,江永网站建设费用合理。
从概率论角度来说,随机数是随机产生的数据(比如抛硬币),但时计算机是不可能产生随机值,真正的随机数也是在特定条件下产生的确定值,只不过这些条件我们没有理解,或者超出了我们的理解范围。计算机不能产生真正的随机数,那么伪随机数也就被称为随机数
--伪随机数:计算机中通过采用梅森旋转算法生成的(伪)随机序列元素
python中用于生成伪随机数的函数库是random
因为是标准库,使用时候只需要import random
random库包含两类函数,常用的共8个
--基本随机函数: seed(), random()
--扩展随机函数:randint(), getrandbits(), uniform(), randrange(), choice(), shuffle()
本文主要是基于下面优秀博客文的总结和梳理:
概率论中常见分布总结以及python的scipy库使用:两点分布、二项分布、几何分布、泊松分布、均匀分布、指数分布、正态分布
(侵删。)
概率分布有两种型别:离散(discrete)概率分布和连续(continuous)概率分布。
离散概率分布也称为概率质量函式(probability mass function)。离散概率分布的例子有伯努利分布(Bernoulli distribution)、二项分布(binomial distribution)、泊松分布(Poisson distribution)和几何分布(geometric distribution)等。
连续概率分布也称为概率密度函式(probability density function),它们是具有连续取值(例如一条实线上的值)的函式。正态分布(normal distribution)、指数分布(exponential distribution)和β分布(beta distribution)等都属于连续概率分布。
一些分析结论和注意点:
1)PDF是连续变量特有的,PMF是离散随机变量特有的;
2)PDF的取值本身不是概率,它是一种趋势(密度)只有对连续随机变量的取值进行积分后才是概率,也就是说对于连续值确定它在某一点的概率是没有意义的;
3)PMF的取值本身代表该值的概率。
PDF -(积分)- CDF
PDF描述了CDF的变化趋势,即曲线的斜率。
PMF [离散随机变量 概率]
伯努利试验:
伯努利试验是在同样的条件下重复地、各次之间相互独立地进行的一种试验。
即只先进行一次伯努利试验,该事件发生的概率为p,不发生的概率为1-p。这是一个最简单的分布,任何一个只有两种结果的随机现象都服从0-1分布。
最常见的例子为抛硬币
其中:
即做n个两点分布的实验
其中:
对于二项分布,可以参考
二项分布的应用场景主要是,对于已知次数n,关心发生k次成功。
,即为二项分布公式可求。
对于抛硬币的问题,做100次实验,观察其概率分布函式:
[图片上传失败...(image-dbd774-1517353918840)]
观察概率分布图,可以看到,对于n = 100次实验中,有50次成功的概率(正面向上)的概率最大。
如果随机变量X的所有取值都可以逐个列举出来,则称X为离散型随机变量。相应的概率分布有二项分布,泊松分布。
如果随机变量X的所有取值无法逐个列举出来,而是取数轴上某一区间内的任一点,则称X为连续型随机变量。相应的概率分布有正态分布,均匀分布,指数分布,伽马分布,偏态分布,卡方分布,beta分布等。(真多分布,好恐怖~~)
在离散型随机变量X的一切可能值中,各可能值与其对应概率的乘积之和称为该随机变量X的期望值,记作E(X) 。比如有随机变量,取值依次为:2,2,2,4,5。求其平均值:(2+2+2+4+5)/5 = 3。
期望值也就是该随机变量总体的均值。 推导过程如下:
= (2+2+2+4+5)/5
= 1/5 2 3 + 4/5 + 5/5
= 3/5 2 + 1/5 4 + 1/5 5
= 0.6 2 + 0.2 4 + 0.2 5
= 60% 2 + 20% 4 + 20%*5
= 1.2 + 0.8 + 1
= 3
倒数第三步可以解释为值为2的数字出现的概率为60%,4的概率为20%,5的概率为20%。 所以E(X) = 60% 2 + 20% 4 + 20%*5 = μ = 3。
0-1分布(两点分布),它的随机变量的取值为1或0。即离散型随机变量X的概率分布为:P{X=0} = 1-p, P{X=1} = p,即:
则称随机变量X服从参数为p的0-1分布,记作X~B(1,p)。
在生活中有很多例子服从两点分布,比如投资是否中标,新生婴儿是男孩还是女孩,检查产品是否合格等等。
大家非常熟悉的抛硬币试验对应的分布就是二项分布。抛硬币试验要么出现正面,要么就是反面,只包含这两个结果。出现正面的次数是一个随机变量,这种随机变量所服从的概率分布通常称为 二项分布 。
像抛硬币这类试验所具有的共同性质总结如下:(以抛硬币为例)
通常称具有上述特征的n次重复独立试验为n重伯努利试验。简称伯努利试验或伯努利试验概型。特别地,当试验次数为1时,二项分布服从0-1分布(两点分布)。
举个栗子:抛3次均匀的硬币,求结果出现有2个正面的概率 。
已知p = 0.5 (出现正面的概率) ,n = 3 ,k = 2
所以抛3次均匀的硬币,求结果出现有2个正面的概率为3/8。
二项分布的期望值和方差 分别为:
泊松分布是用来描述在一 指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布 。生活中服从泊松分布的例子比如有每天房产中介接待的客户数,某微博每月出现服务器瘫痪的次数等等。 泊松分布的公式为 :
其中 λ 为给定的时间间隔内事件的平均数,λ = np。e为一个数学常数,一个无限不循环小数,其值约为2.71828。
泊松分布的期望值和方差 分别为:
使用Python绘制泊松分布的概率分布图:
因为连续型随机变量可以取某一区间或整个实数轴上的任意一个值,所以通常用一个函数f(x)来表示连续型随机变量,而f(x)就称为 概率密度函数 。
概率密度函数f(x)具有如下性质 :
需要注意的是,f(x)不是一个概率,即f(x) ≠ P(X = x) 。在连续分布的情况下,随机变量X在a与b之间的概率可以写成:
正态分布(或高斯分布)是连续型随机变量的最重要也是最常见的分布,比如学生的考试成绩就呈现出正态分布的特征,大部分成绩集中在某个范围(比如60-80分),很小一部分往两端倾斜(比如50分以下和90多分以上)。还有人的身高等等。
正态分布的定义 :
如果随机变量X的概率密度为( -∞x+∞):
则称X服从正态分布,记作X~N(μ,σ²)。其中-∞μ+∞,σ0, μ为随机变量X的均值,σ为随机变量X的标准差。 正态分布的分布函数
正态分布的图形特点 :
使用Python绘制正态分布的概率分布图:
正态分布有一个3σ准则,即数值分布在(μ-σ,μ+σ)中的概率为0.6827,分布在(μ-2σ,μ+2σ)中的概率为0.9545,分布在(μ-3σ,μ+3σ)中的概率为0.9973,也就是说大部分数值是分布在(μ-3σ,μ+3σ)区间内,超出这个范围的可能性很小很小,仅占不到0.3%,属于极个别的小概率事件,所以3σ准则可以用来检测异常值。
当μ=0,σ=1时,有
此时的正态分布N(0,1) 称为标准正态分布。因为μ,σ都是确定的取值,所以其对应的概率密度曲线是一条 形态固定 的曲线。
对标准正态分布,通常用φ(x)表示概率密度函数,用Φ(x)表示分布函数:
假设有一次物理考试特别难,满分100分,全班只有大概20个人及格。与此同时语文考试很简单,全班绝大部分都考了90分以上。小明的物理和语文分别考了60分和80分,他回家后告诉家长,这时家长能仅仅从两科科目的分值直接判断出这次小明的语文成绩要比物理好很多吗?如果不能,应该如何判断呢?此时Z-score就派上用场了。 Z-Score的计算定义 :
即 将随机变量X先减去总体样本均值,再除以总体样本标准差就得到标准分数啦。如果X低于平均值,则Z为负数,反之为正数 。通过计算标准分数,可以将任何一个一般的正态分布转化为标准正态分布。
小明家长从老师那得知物理的全班平均成绩为40分,标准差为10,而语文的平均成绩为92分,标准差为4。分别计算两科成绩的标准分数:
物理:标准分数 = (60-40)/10 = 2
语文:标准分数 = (85-95)/4 = -2.5
从计算结果来看,说明这次考试小明的物理成绩在全部同学中算是考得很不错的,而语文考得很差。
指数分布可能容易和前面的泊松分布混淆,泊松分布强调的是某段时间内随机事件发生的次数的概率分布,而指数分布说的是 随机事件发生的时间间隔 的概率分布。比如一班地铁进站的间隔时间。如果随机变量X的概率密度为:
则称X服从指数分布,其中的参数λ0。 对应的分布函数 为:
均匀分布的期望值和方差 分别为:
使用Python绘制指数分布的概率分布图:
均匀分布有两种,分为 离散型均匀分布和连续型均匀分布 。其中离散型均匀分布最常见的例子就是抛掷骰子啦。抛掷骰子出现的点数就是一个离散型随机变量,点数可能有1,2,3,4,5,6。每个数出现的概率都是1/6。
设连续型随机变量X具有概率密度函数:
则称X服从区间(a,b)上的均匀分布。X在等长度的子区间内取值的概率相同。对应的分布函数为:
f(x)和F(x)的图形分别如下图所示:
均匀分布的期望值和方差 分别为:
首先谢谢邀请,
python中有的算法还是比较多的?
python之所以火是因为人工智能的发展,人工智能的发展离不开算法!
感觉有本书比较适合你,不过可惜的是这本书没有电子版,只有纸质的。
这本书对于算法从基本的入门到实现,循序渐进的介绍,比如里面就涵盖了数学建模的常用算法。
第 1章 从数学建模到人工智能
1.1 数学建模1.1.1 数学建模与人工智能1.1.2 数学建模中的常见问题1.2 人工智能下的数学1.2.1 统计量1.2.2 矩阵概念及运算1.2.3 概率论与数理统计1.2.4 高等数学——导数、微分、不定积分、定积分
第2章 Python快速入门
2.1 安装Python2.1.1 Python安装步骤2.1.2 IDE的选择2.2 Python基本操作2.2.1 第 一个小程序2.2.2 注释与格式化输出2.2.3 列表、元组、字典2.2.4 条件语句与循环语句2.2.5 break、continue、pass2.3 Python高级操作2.3.1 lambda2.3.2 map2.3.3 filter
第3章 Python科学计算库NumPy
3.1 NumPy简介与安装3.1.1 NumPy简介3.1.2 NumPy安装3.2 基本操作3.2.1 初识NumPy3.2.2 NumPy数组类型3.2.3 NumPy创建数组3.2.4 索引与切片3.2.5 矩阵合并与分割3.2.6 矩阵运算与线性代数3.2.7 NumPy的广播机制3.2.8 NumPy统计函数3.2.9 NumPy排序、搜索3.2.10 NumPy数据的保存
第4章 常用科学计算模块快速入门
4.1 Pandas科学计算库4.1.1 初识Pandas4.1.2 Pandas基本操作4.2 Matplotlib可视化图库4.2.1 初识Matplotlib4.2.2 Matplotlib基本操作4.2.3 Matplotlib绘图案例4.3 SciPy科学计算库4.3.1 初识SciPy4.3.2 SciPy基本操作4.3.3 SciPy图像处理案例第5章 Python网络爬虫5.1 爬虫基础5.1.1 初识爬虫5.1.2 网络爬虫的算法5.2 爬虫入门实战5.2.1 调用API5.2.2 爬虫实战5.3 爬虫进阶—高效率爬虫5.3.1 多进程5.3.2 多线程5.3.3 协程5.3.4 小结
第6章 Python数据存储
6.1 关系型数据库MySQL6.1.1 初识MySQL6.1.2 Python操作MySQL6.2 NoSQL之MongoDB6.2.1 初识NoSQL6.2.2 Python操作MongoDB6.3 本章小结6.3.1 数据库基本理论6.3.2 数据库结合6.3.3 结束语
第7章 Python数据分析
7.1 数据获取7.1.1 从键盘获取数据7.1.2 文件的读取与写入7.1.3 Pandas读写操作7.2 数据分析案例7.2.1 普查数据统计分析案例7.2.2 小结
第8章 自然语言处理
8.1 Jieba分词基础8.1.1 Jieba中文分词8.1.2 Jieba分词的3种模式8.1.3 标注词性与添加定义词8.2 关键词提取8.2.1 TF-IDF关键词提取8.2.2 TextRank关键词提取8.3 word2vec介绍8.3.1 word2vec基础原理简介8.3.2 word2vec训练模型8.3.3 基于gensim的word2vec实战
第9章 从回归分析到算法基础
9.1 回归分析简介9.1.1 “回归”一词的来源9.1.2 回归与相关9.1.3 回归模型的划分与应用9.2 线性回归分析实战9.2.1 线性回归的建立与求解9.2.2 Python求解回归模型案例9.2.3 检验、预测与控制
第10章 从K-Means聚类看算法调参
10.1 K-Means基本概述10.1.1 K-Means简介10.1.2 目标函数10.1.3 算法流程10.1.4 算法优缺点分析10.2 K-Means实战
第11章 从决策树看算法升级
11.1 决策树基本简介11.2 经典算法介绍11.2.1 信息熵11.2.2 信息增益11.2.3 信息增益率11.2.4 基尼系数11.2.5 小结11.3 决策树实战11.3.1 决策树回归11.3.2 决策树的分类
第12章 从朴素贝叶斯看算法多变 193
12.1 朴素贝叶斯简介12.1.1 认识朴素贝叶斯12.1.2 朴素贝叶斯分类的工作过程12.1.3 朴素贝叶斯算法的优缺点12.2 3种朴素贝叶斯实战
第13章 从推荐系统看算法场景
13.1 推荐系统简介13.1.1 推荐系统的发展13.1.2 协同过滤13.2 基于文本的推荐13.2.1 标签与知识图谱推荐案例13.2.2 小结
第14章 从TensorFlow开启深度学习之旅
14.1 初识TensorFlow14.1.1 什么是TensorFlow14.1.2 安装TensorFlow14.1.3 TensorFlow基本概念与原理14.2 TensorFlow数据结构14.2.1 阶14.2.2 形状14.2.3 数据类型14.3 生成数据十二法14.3.1 生成Tensor14.3.2 生成序列14.3.3 生成随机数14.4 TensorFlow实战
希望对你有帮助!!!
贵在坚持,自己掌握一些,在工作中不断打磨,高薪不是梦!!