遗传算法框架GAFT已支持自定义编码方式
前言
遗传算法中个体的编码方式有很多比如二进制编码,实数编码,格雷编码,符号编码等等。之前我写的遗传算法框架提供了两种固定的编码方式: 二进制编码和实数编码。但是这些编码方式都是写死在GAIndividual
类的encode
和decode
方法里的。为了使得gaft能够灵活的支持更多的编码方式,我对个体的定义进行了更新,目前可以通过实现接口自定义编码方式了。目前仍然内置二进制编码和实数编码方式,不过实现的方式已经与以前不同。
可以参考v0.5.0的CHANGELOG
正文
在这里我就介绍一下接口的更新和使用方法。
个体基类
个体基类IndividualBase
是一个抽象基类用于自定义编码个体时候继承。主要需要实现的就两个方法encode
和decode
。其中encode
方法把solution
候选解进行编码成chromsome
染色体列表比如编码成二进制列表,相反,decode
方法则把chromsome
解码成候选解solution
。
1 | class IndividualBase(object): |
同时IndividualBase
还实现了初始化和随机初始化个体的方法,具体实现参见:https://github.com/PytLab/gaft/blob/master/gaft/components/individual.py
二进制编码个体
这里为了区别个体编码方式的不同,个体的定义的名字都进行了更改,例如二进制编码个体命名为BinaryIndividual
,指代这此个体的编码方式为二进制编码。
定义BinaryIndividual
类的时候,需要继承IndividualBase
并实现encode
和decode
方法:
1 | class BinaryIndividual(IndividualBase): |
具体实现参见: https://github.com/PytLab/gaft/blob/master/gaft/components/binary_individual.py
实数编码(浮点编码)
对于一些多维、高精度要求的连续函数优化问题,使用二进制编码来表示个体时将会有一些不利之处。二进制编码存在着连续函数离散化时的映射误差。个体长度较知时,可能达不到精度要求,而个体编码长度较长时,虽然能提高精度,但却使遗传算法的搜索空间急剧扩大。
所谓浮点法,是指个体的每个基因值用某一范围内的一个浮点数来表示。在浮点数编码方法中,必须保证基因值在给定的区间限制范围内,遗传算法中所使用的交叉、变异等遗传算子也必须保证其运算结果所产生的新个体的基因值也在这个区间限制范围内。
其实实现浮点编码的个体很简单,因为我们的solution
本身就是使用浮点数表示的,唯一需要注意的是解向量中元素的取值范围的限定。此编码个体的实现方式也可以作为其他自定义编码方式个体的参考。
1 | from .individual import IndividualBase |
具体的范围限制则需要在变异算子中进行个体的编码方式判断并针对性的处理, 具体的实现参考: https://github.com/PytLab/gaft/blob/master/gaft/operators/mutation/flip_bit_mutation.py
关于自定义编码方式
对于在使用GAFT中自定义编码方式,需要以下两点即可:
- 实现一个新的
Individual
类继承自IndividualBase
,然后实现相应编码方式的encode
和decode
接口。 - 在mutation算子中的
mutate
方法中加入相应编码方式个体的变异操作
总结
目前GAFT已支持自定义编码方式,并内置了二进制编码和实数编码,使用的童鞋若实现了较好的编码个体欢迎Pull Request