在许多仿真过程中,事件的发生是随机的,或者事件属性值的确定具有偶然性。由于这些随机因素的存在,在建模过程中就需要用服从各种分布的随机变量来描述系统中存在的随机和偶然性问题。随机变量的产生基础是随机数,随机数可以通过对[0,1]区间上均匀分布抽样生成。曾经使用过的真正随机数的发生源包括:
l 一袋小球,进行可替换抽样;
l 微秒级时钟上的低阶数字;
l 一个随机电子噪声源的周期性量化输出值。
这些方法都可以产生真正的随机数。但它们有一个共同的缺点,就是应用在仿真研究中时,用这些方法产生的随机数序列通常不能复现。而在很多情况下,系统决策需要进行多次仿真比较才能确定,因此对于随机数序列重现性也是非常必要的。
大多数计算机语言都提供能够产生随机数的过程或函数,同样仿真软件也能产生用于事件发生时间和其它随机变量的随机数。本章讨论随机数的产生方法以及它们的随机性检验。
(1) 确定事件和随机事件
确定事件:在给定条件下进行的试验中,一定发生或一定不发生的事件分别称为必然事件和不可能事件,这类事件是确定性的,总称为确定事件。例如掷一次骰子共有6 种可能的点数结果,表示为
S={1,2,3,4,5,6}
式中:S 表示样本空间,{ }符号表示集合;集合中每个数字表示一个元素,则每个元素正好对应着一种可能的结果。在进行一次掷骰子实验时,出现的点数处于[1,6]之间的整数是必然事件;出现的点数在[1,6]之外的整数是不可能事件;在试验之前,确定知道出现的点数在[1,6]之间,也确定知道出现的点数不可能出现在[1,6]之外。
随机事件:在给定条件下进行的试验中,可能发生也可能不发生,而在大量重复试验中却具有某种规律性的事件,称为随机事件。针对掷骰子试验,虽然知道每次试验结果肯定为[1,6]之间的整数,但是每次试验结果是这六个数字中的哪一个数值却是不确定的,但是在多次试验后,试验出现1、2、3、4、5、6结果的次数具有一定的规律性。
(2)随机变量与概率
随机变量:如果试验的每个结果用变量的一个值来表示,即E的值根据试验结果来确定,因而它取什么值是随机的,而且对任意实数χ,ξ<χ是一个随机事件,这种变量称为随机变量。例如某一工人所生产的产品出现一级品的可能性为P。现在连续生产5 件产品,其中一级品件数就是一个随机变量。它的可能取值为0,1,2,3,4,5。“X=i”意味着在5 件产品中:“一级品有i 件”。
频率:如果对某项试验重复进行了n次,事件A发生了m次,则称A在这次试验中的频率为m/n。在大量重复某项试验时,就会发现事件的频率在试验次数很大而且不断增大的过程中呈现稳定性。这种统计规律性表明:事件发生的可能性大小是事件本身固有的客观属性。称事件A发生可能性的大小为事件A的概率,记为P(A)。当试验次数n足够大时,可以用事件的频率作为事件概率的近似值,即
P(A)≈m/n
概率是一个在区间[0,1]上取值的实数。
随机变量ξ取值小于实数χ的可能性大小,即随机事件
0≤P(ξ<χ)≤1
在对运作系统的建模过程中,经常要研究一些不确定的随机事件,需要引入概率分布,这在典型的运作系统如排队系统、库存系统以及系统可靠性、维修性研究中都有很多的实例。在排队系统中,实体到达的时间间隔和接受服务的时间通常是不确定的。在存储系统之中,需求量以及订货到收货的时间间隔也是不确定的。在系统可靠性模型中,也有很多不确定的因素,如系统内部件发生故障的时间以及发生故障部件的修复时间都是不确定的。在这些系统中,随机事件发生的概率必然满足一定的分布,而系统建模的任务之一就是确定系统中各种随机事件发生的概率分布形式。完全准确地描述这些分布形式是困难的,一般是从己知的概率分布形式中寻找近似者。各种已知的概率分布都有其各不相同的特性,因此,选择适宜的随机变量概率分布形式,建立合理的系统概率统计模型是系统建模的一个重要方面。本节讨论在上述几种典型的运作系统应用领域中适用的概率统计模型。
1.2.1 排队系统
在排队系统中,主要有两种类型的活动,即实体到达和实体接受服务。一般情况下,实体到达的时间间隔是不确定的,从而在一定时间内到达的实体数目也是一个随机变量;另一方面,实体接受服务的时间也总是不确定的,从而造成队列的长短也是随机的。
实体到达的模式一般用泊松分布来描述,即在固定的时间内到达系统的实体数目服从泊松分布。这种模式的特点是:
① 在一定时间间隔内到达实体的数目仅与时间间隔的长短有关,而与这段时间间隔的起始时刻无关。
② 在某个时间间隔内,到达的实体数目与在此之前到达的实体数目无关,也不影响在此之后实体的到达。
③ 不存在两个或两个以上实体同时到达的情况。
④ 若在一定时间内到达系统的实体数目χ服从参数为A的泊松分布,则相邻到达的两个实体之间的到达时间间隔T服从参数为λ的指数分布。
如果服务时间完全是随机的,通常在建模过程中用指数分布描述。服务时间也可能是在某个常数附近波动,例如同样产品的加工时间应当总是相同的,但是由于产品自身或加工工具的原因可能引起加工时间稍有不同。在这种情况下,服务时间可以用正态分布描述。
T分布和威布尔分布也可以被用于模仿到达时间间隔和服务时间。实际上,指数分布可以看成是T分布和威布尔分布的特殊情况。
1.2.2 库存系统
在现实的库存系统中有三个随机变量:
① 每次订货或单位周期内的需求量,
② 两次需求间的时间间隔,
③ 发出订单和收到订货间的时间间隔,也称为提前期。
在最简单的库存系统数学模型中,需求量始终为常数,而提前期也是零或常数。但大多数实际情况中需求的时间是随机出现的,而每次的需求量也是随机的。
从一般意义上讲,订货提前期的分布通常和T分布是非常拟合的。但在研究库存系统时,考虑的主要因素是需求量而不是提前期,提前期一般只视为对库存策略的一种制约,因此在多数情况下,将提前期的分布简化为用均匀分布来描述或者用正态分布来描述。
几何分布、二项分布以及泊松分布都可以用来描述需求的分布,它们分别提供了满足各种需求模式的分布形式,即在一定周期内的需求量的分布。几何分布是特殊情况的二项分布,它描述了至少出现一次需求的概率。常用的描述需求的分布形式是泊松分布。
1.2.3 可靠性与维修性
可靠性对于那些一旦发生故障就会造成重大损失的系统来说是至关重要的。在系统可靠性与维修性建模中,优先考虑的随机变量是系统中部件的无故障工作时间和故障后的修复时间。通常部件发生故障的时间分布和修复时间的分布用指数分布来描述,也可以用T分布和威布尔分布。如果故障是完全随机的,则可以采用指数分布建模。如果部件有储备,且每个备件的故障发生时间服从指数分布,则可以采用T分布来建模。威布尔分布已经广泛用于描述故障发生时间,原因是它逼近许多观察结果,当系统中有许多部件的故障是由子大量元件的严重失效或可能失效造成时,适合采用威布尔分布建立模型。正态分布适用于那些大多数故障是由于磨损产生的系统。
综上所述可以看出,在运作系统建模过程中,随机变量较常采用的分布形式是指数分布和正态分布,其主要原因为:
①指数分布简单,数据处理容易。
②指数分布的一个重要特点是无记忆性,这与大多数与时间有关的随机现象是一致的。例如在排队服务系统中,经过很长时间才有顾客到达,并不会对下一个顾客到达的时间产生影响。同样,服务台不会因为已经工作了很长时间就会缩短为下一个顾客的服务时间。又如电子元器件在工作了一段时间后继续使用,其在固定的时间内发生故障的概率与一个新的元器件完全一样。
③指数分布与许多其它的分布形式有关,一般作为特例,如泊松分布、威布尔分布、T分布等。作为指数分布的补充,这些分布形式也大量地应用在运作系统的建模过程中。
在获得了有关随机变量的观测数据之后,需要拟合其服从怎样的随机分布函数,一般通过如下两步:
Ø 由观测数据估计随机变量的函数类型;
Ø 由观测数据和类型估计随机函数的参数;
拟合优度检验;