CSharp Archive

C#模拟登录微博请求passport.weibo.com结果

在《在C#中调用微博密码加密文件ssologin.js》一文中,我们讲到在请求ssologin.js之后,成功返回了passport.weibo.com的链接,传说中的最终登录的链接。参考《全程模拟新浪微博登录(2015)》中提到的成功登录的方法,我却没有成功,这里先总结我尝试过的方式,然后再谈谈我请求失败可能的原因。

在C#中调用微博密码加密文件ssologin.js

最近在尝试用C#实现模拟登录新浪微博,已实现预登录获取客户端对用户密码进行加密的参数,在C#中调用加密文件ssologin.js对用户密码进行加密,获取最终登录请求的链接,目前卡在了最终登录需要的Cookie中。这里先记录尝试成功的部分,也是一次梳理思路的过程,后续会陆续整理我尝试过的Cookie方案以及在学习过程中发现的一些值得分享的内容。

C#正则表达式应用范例

C#正则表达式是C#爱好者们处理文本最有力的工具,而对于初学者而言,应用范例应该比各种口诀要更实用一些。近期在学习正则表达式,整理了一些自认为有用的资料以及两个比较典型的正则表达式应用,记录下来备用。

训练Tesseract3字库图文详解

训练Tesseract3字库可以提高Tesseract对特定字库的识别率。本文记录了我训练字库的详细步骤,字库训练完成后在Tesseract-OCR中成功调用,另外也记录了我在训练Tesseract3字库中遇到的问题点以及相应的解决方案。

Tesseract3.02在VS2012中的使用方法

Tesseract3.02是Google维护的一个OCR识别图片文字的开源项目。而A .Net wrapper for tesseract-ocr则是可供.Net平台应用程序使用Tesseract3.02的程序包,由Charles Weld在Github上创建的开源项目,下载量大且持续更新,至本文发布该项目最新更新日期为2015/7/25,值得程序员们信赖。本文和大家分享通过A .Net wrapper for tesseract-ocr在​VS2012工程中使用Tesseract3.02的方法。​

WebBrowser与mshtml获取动态验证码

动态验证码:同一个链接,但每次请求都得到不同图片的验证码。这种验证码我们可以通过WebBrowser与mshtml结合的方式来获取,可以确保我们获取到本地的验证码图片与第一次请求该验证码所在网页中的图片一致。

验证码粘连字符分割经验谈

验证码粘连字符分割作为业余学习课题已经有一段时间了,分割对象是TAOBAO上白底蓝字的四字符粘连的验证码​。期间主要研究了两类分割算法。第一类是寻找细化字符的谷点,然后根据谷点对粘连字符进行分割;第二类是基于字符特征来对粘连字符进行分割,也就是本博客中连载的《粘连字符“花式分割”》。

粘粘字符“花式分割”___guideline principle

guideline principle依据字符与三格线的关系来进行分割。根据26个字母的大小写在四线三格中的分布状况来看,正常状况下,没有一个字符会同时占据三格,而所有数字应该均在baseline以上区域。 因此,粘连区域与guideline和baseline的左右侧交点只要不位于边界即可作为分割点。guideline principle根据粘连区域与四线三格的关系分为两大类:占据三格,占据baseline以上两格,占据meanline以下两格。

粘粘字符“花式分割”___loop and guideline

loop and guideline是本系列文章讨论的算法的两个核心,loop principle可以将包含自然loop的区块完全分割,可惜不是每张图片都包含自然loop。对于执行loop principle之后仍粘连的状况将完全交由guideline principle来处理。讲述这两者的合作方式便是本文的中心思想,仍然以TAOBAO四字符白底蓝字的验证码为研究对象。

粘粘字符“花式分割”___draw guide lines

draw guide lines是粘粘字符“花式分割”算法中的第二大法宝,在《粘粘字符”花式分割”___原理概述》有提到guide lines包含四种线条:ascender line, mean line, base line, descender line,在粘粘字符“花式分割”算法中通过绘制mean line 和 base line 来帮助我们分割字符,本文主要讨论mean line 和base line的绘制方法。
Fork me on GitHub