这几天在做一些验证码的识别,以前在写爬虫遇到验证码时我通常会去调用一些打码平台,但这次我想自己来尝试研究下验证码的识别,我用的是golang+opencv+tesseract。我把自己遇到的一些问题记录下来,先讲讲go如何改变某个像素的颜色。
我们的验证码大概长这样(有的容易有的难,关键是那个字符的切割我感觉不太好切,有的挨得紧。其实是自己太菜了)
然后我们不难发现他们有一个共同特点,那就是**他们都是字母和数字!** emmmm那是扯淡,他们的干扰线都是黑色的。于是才有了今天的文章。
在go语言中,需要使用一个类型断言来使用Set()方法
type Img interface { // 使用类型断言
Set(x, y int, c color.Color)
}
// 我这里用的gocv(opencv的golang版本)
src := gocv.IMRead(imgPath, gocv.IMReadFlag(1))
img, _ := src.ToImage() // 转化成img
// 你使用img的话对应的坐标可以如下获取
// bounds := img.Bounds()
// fmt.Println(bounds.Dx(),bounds.Dy())
// fmt.Println(src.Cols(),src.Rows())
// 获取rgba并将黑色替换为白色
for i := 0; i < src.Cols(); i++ {
for j := 0; j < src.Rows(); j++ {
cl := img.At(i, j)
r, g, b, _ := cl.RGBA()
//fmt.Println(r, g, b, a)
// 经过观察, 那个rbg颜色对应go里的13107 13107 13107 具体的可以看go的源码是怎么运算的
if r == 13107 && g == 13107 && b == 13107 {
img.(Img).Set(i, j, color.RGBA{255, 255, 255, 255}) //设置为白色
}
}
}
这里就是如何使用golang改变图像的某个像素的颜色的方法了